Sammenligning av distribuerte filsystemer HDFS VS Ceph

Comparison Distributed File Systems Hdfs Vs Ceph



1. Sammendrag:

Nylig lærte jeg om Ceph, og jeg vil alltid sammenligne det med HDFS. Det ene er å lage et trinnvis sammendrag, og det andre er å utdype min forståelse av de to distribuerte filsystemene.

2. Gjennomgang:

1. HDFS er basert på utviklingen av Google FS (GFS). Det startet relativt tidlig og er et ofte brukt distribuert filsystem i store dataløsninger. HDFS i Hadoop-løsningen er som følger:





HDFS-arkitektur er som følger :



Namenode er ansvarlig for metadata for filsystemet, og datanode er ansvarlig for de virkelige datablokkene.


2. Ceph-historie: referer til Ceph Introduction Series (1): Ceph History



Ceph-arkitekturen er som følger :

Ceph ble opprinnelig designet for å bli et distribuert filsystem, men med det store antallet applikasjoner av cloud computing vil den til slutt støtte tre former for lagring: blokkering og lagring av objekter.
Lagring, filsystem

Prinsipper for Ceph Object Storage

Tre, sammenligning:

HDFS og Ceph det samme punkt

HDFS

Ceph

Distribuert filsystemklynge

Ja

Ja

Strukturmønster Master / Slave Klient server

Kan den brukes som et back-end distribuert filsystem for Hadoop

Ja

Ja, librados har et Java-grensesnitt. Referanse: http://docs.ceph.com/docs/master/cephfs/hadoop/

Redundant motstand mot kopikatastrofer

Ja

Ja

Skalerbarhet

Ja

Ja

Høy effektivitet

høy

Veldig høy

HDFS og Ceph annerledes punkt

HDFS

Ceph

Programmeringsspråk for kildekode

java

C ++ (ceph-klient gir C ++ / C / Java / python og andre språk)

Filsystemtype

Lagring av filer

Objektlagring (selv om klienten tilbyr blokk (RBD) / fil (CephFS) / objektlagring (RGW), er server-side lagring backend Filestore / Blutstore egentlig objektlagring).

Vennligst se: Opprinnelsen og egenskapene til de tre Ceph-lagringsgrensesnittene (blokk / fil / objekt)

Enten basert på det lokale filsystemet

HDFS er basert på det lokale filsystemet

Cephs lagringsbackend FileStore er basert på det lokale filsystemet BlueStore er ikke basert på det lokale filsystemet, men direkte basert på blokkeringsenheter. RocketDB brukes til å administrere metadata, og BlueFS registrerer loggfilsystemet.

Vennligst se: Ceph avansert serie (1): noen grunnleggende konsepter (2 av 2, delvis server-side OSD)

Inndeling i det distribuerte filsystemet

Filen er delt inn i blokker (standardkonfigurasjonen av blokkstørrelse er 128M)

Filen er delt inn i objekter (standardkonfigurasjonen for objektstørrelsen er 4M)

Bind sjefen (løsning)

Big data-løsninger (Hadoop / Spark, etc.)

Distribusjonsmetode for cloud computing-løsning (Openstack)

slutt:

Hvis du vil vite mer om de andre forskjellene mellom de to filsystemene, kan du legge igjen en melding.