MapReduce

Üst Kategoriler :

Bu Kategoriye İçerik Girin veya Soru Sorun

Bu Sayfayı Paylaş:

İçindekiler-Dizin

Amazon Elstik MapReduce (Amazon Elastic MapRe.. Çok Büyük Veriler İçerisinden Sonuçlar Çıkarm.. Google MapReduce Çalışma Şekli Hadoop ile Bir Dosyadaki Kelime Sayısını Bula.. MapReduce MapReduce Çalışma Sistemi MapReduce ile Verilerin Nasıl İşlendiğini Gös.. MapReduce Resmi MapReduce Sunumu

MapReduce Kategorisi ile İlgili Kavramlar

Tanım: Map şeklinde saklanmış bir veri bütünü içerisinde istenilen sonuca reduce(azalt) yöntemi ile ulaşılmasını sağlayan yöntem
Tanım: Büyük verilerin dağıtık bir sistemde saklanmasını ve MapReduce tekniği ile sonuçların üretilmesini sağlayan tüm teknolojilerin ortak adı.
Tanım: Google şirketinin MapReduce tekniği ile geliştirdiği çok büyük verileri dağıtık bir sistemde saklanmasını ve gerekli verilerin hızlı bir şekilde bulunmasını sağladığı teknolojisi

Amazon Elstik MapReduce (Amazon Elastic MapReduce)

Tanım: Amazon firmasının Amazon Web Servislerinde sunulan , Hadoop altyapısını kullanarak MapReduce yöntemi ile veriler ile ilgili sonuçlara ulaşılmasını sağlayan hizmet.

MapReduce Kategorisi ile İlgili Resim-Video gibi Materyaller

Google MapReduce Çalışma Şekli

Google MapReduce ürününü nasıl çalıştığını gösteren resim

Orjinal Boyutlarıyla Ayrı Pencerede Göster

MapReduce Resmi

MapReduce algoritmasını gösteren resim. http://cookingthecode.com sitesinden gösterilmektedir.

Orjinal Boyutlarıyla Ayrı Pencerede Göster

MapReduce Çalışma Sistemi

MapReduce'un bilgileri nasıl parçaladığını ve sonuç ürettiğini gösteren resim. www.dugumkume.org üzerinden gösterilmektedir.

Orjinal Boyutlarıyla Ayrı Pencerede Göster

MapReduce Kategorisi ile İlgili Örnekler

MapReduce ile Verilerin Nasıl İşlendiğini Gösteren Örnek

Elimizde aşağıdaki gibi veri bulunsun :

A 10
B 3
C 9
A 9
A 10
C 3
D 2
C 29

MapReduce ile A , B , C ve D için sayıların toplamı bulunabilir. Öncelikli olarak map ile tüm bilgi ne kadar iş birimi var ise o kadar bölüme parçalanır. 2 iş birimi olduğunu varsayılabilir :

1.Bölüm

A 10
B 3
C 9
A 9

2.Bölüm

A 10
C 3
D 2
C 29

Parçalama işleminden sonra bölüm her iş bölümünde ayrı bir şekilde reduce işleminden geçirilir ve toplam değerler hesaplanır :

1.Map

A 19
B 3
C 9

2.Map

A 10
C 32
D 2

Her iş biriminde tüm değerler reduce edildikten sonra toplam değerler içinde reduce işlemi yapılır ve sonuç elde edilir :

A 29
B 3
C 41
D 2

Hadoop ile Bir Dosyadaki Kelime Sayısını Bulan Örnek

Aşağıda Hadoop ile bir dosyadaki kelime sayısını bulup başka bir dosyaya yazan örneğin kod görülmektedir :

package wordcount;
import java.io.IOException;
import java.util.*;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.conf.*;
import org.apache.hadoop.io.*;
import org.apache.hadoop.mapred.*;
import org.apache.hadoop.util.*;

public class WordCount {

        public static class Map extends MapReduceBase
 implements Mapper<longwritable, text,="" intwritable="">
        {
          private final static IntWritable one = new IntWritable(1);
          private Text word = new Text();
          public void map(LongWritable key, Text value, 
OutputCollector<text, intwritable=""> 
output, Reporter reporter) throws IOException {
           String line = value.toString();
                StringTokenizer tokenizer = new StringTokenizer(line);
                while (tokenizer.hasMoreTokens())
                   {
                  word.set(tokenizer.nextToken());
                  output.collect(word, one);
                }
          }
        }

        public static class Reduce extends MapReduceBase 
implements Reducer<text, intwritable,="" text,="" intwritable=""> {
          public void reduce(Text key, Iterator<intwritable> values, 
OutputCollector<text, intwritable=""> output, Reporter reporter) 
throws IOException {
                int sum = 0;
                while (values.hasNext())
                   {
                  sum += values.next().get();
                }
                output.collect(key, new IntWritable(sum));
          }
        }

        public static void main(String[] args) throws Exception {
          JobConf conf = new JobConf(WordCount.class);
          conf.setJobName("wordcount");

          conf.setOutputKeyClass(Text.class);
          conf.setOutputValueClass(IntWritable.class);

          conf.setMapperClass(Map.class);
          conf.setCombinerClass(Reduce.class);
          conf.setReducerClass(Reduce.class);

          conf.setInputFormat(TextInputFormat.class);
          conf.setOutputFormat(TextOutputFormat.class);

          FileInputFormat.setInputPaths(conf, new Path(args[0]));
          FileOutputFormat.setOutputPath(conf, new Path(args[1]));

          JobClient.runJob(conf);
        }
}

map fonksiyonu gelen içeriği key , değer şeklinde oluşturup output'a ekleme yapmaktadır. Bu şekilde tüm kelimeler key olarak ve değeri 1 olarak oluşacaktır. reduce'ta ise gelen değerler toplanmaktadır. Bu nedenle aynı kelime ne kadar gelir ise toplam değer bulunmuş olacaktır.

MapReduce

Üst Kategoriler :

Kategori İçi Sözlük

Bu Sayfayı Paylaş:

İçindekiler-Dizin

MapReduce Kategorisi ile İlgili Kavramlar

MapReduce

Amazon Elstik MapReduce (Amazon Elastic MapReduce)

MapReduce Kategorisi ile İlgili Resim-Video gibi Materyaller

Google MapReduce Çalışma Şekli

MapReduce Resmi

MapReduce Çalışma Sistemi

MapReduce Kategorisi ile İlgili Örnekler

MapReduce ile Verilerin Nasıl İşlendiğini Gösteren Örnek

Hadoop ile Bir Dosyadaki Kelime Sayısını Bulan Örnek

MapReduce Kategorisi ile İlgili Site Dışı Kaynaklar

MapReduce Sunumu

İçindekiler-Dizin

Bu Sayfayı Paylaş:

İletişim Bilgileri

Takip Et