Tag Hadoop

Apache Mahout 0.6 veröffentlicht

Heute hat die Apache Software Foundation (ASF) das Machine-Learning-Framework Mahout in Version 0.6 veröffentlicht. Es gab viele Fehlerbehebungen und Verbesserungen. Insgesamt wurde 182 JIRAs geschlossen. Dazu zählen unter anderem die Fehlerreports [MAHOUT-807] - Wrong prefixes in PrefixAdditionFilter und [MAHOUT-809] - Bad bug in ChunkedWriter von Florian Bausch.

Interessant sind aber auch die Reports [MAHOUT-890] - Performance issue in FPGrowth und [MAHOUT-921] - FPG uses a lot of boxed primitives - this patch eliminates a bunch of List<Integer>, die einige, teils gravierende, Probleme im implementierten FP-Growth Algorithmus beheben.

Hier noch die Mail von der Mailing Liste:

Apache Mahout has reached version 0.6. All ...

 

Apache Hadoop 1.0 available

On December 27th, 2011, the Apache Software Foundation made the first major release verison of Apache Hadoop available. The release notes of the 1.0.0 version show lots of development activities and list a huge number of resolved bugs.

Apache Hadoop is a Java software that allows users to store and work with petabytes of data and run programs in a Google developed MapReduce environment.

In MapReduce programs the data is processed in key-value pairs. During the Map process, which runs in parallel on the input data, the key-value-pairs are grouped to lists: Map(k1,v1) → list(k2,v2 ...