Puncte:-1

De ce Hadoop și Spark nu sunt în depozitele oficiale Ubuntu?

drapel cn

UPDATE (2021-11-13 22:12 GMT+8): în ceea ce privește pachetele Snap, @karel a sugerat că această întrebare este o copie a De ce depozitele Ubuntu nu au cele mai recente versiuni de software? Nu sunt de acord, pentru că (1) Snaps-urile, fiind autonome și împachetate cu toate dependențele sale, sunt diferite de pachetele deb și m-aș aștepta ca primele să urmărească mai îndeaproape în amonte și (2) chiar dacă nu, m-aș aștepta ca acestea să fi în stabil până acum.


Văd că asta a fost deja întrebat Hadoop & Spark - de ce nu există pachete Ubuntu? , dar (1) asta a fost în 2015 și peisajul informatic s-a schimbat mult de atunci și (2) singurul răspuns la acea altă întrebare nu îi răspunde cu adevărat, așa că m-am gândit că ar fi potrivit să întreb din nou.

Așadar, acum, în 2021, cloud computing și big data au devenit doar mai omniprezente în comparație cu 2015. Având în vedere că unul dintre cazurile majore de utilizare a Linux este în cloud computing / big data, de ce este modul de facto de a configura Hadoop și Spark ( cadre-cheie legate de procesarea datelor mari) încă descarcă și despachetează arhivele din amonte, în loc să preia pachetele binare corespunzătoare din depozitele oficiale Ubuntu, rulând o aplicație adecvată. instalare apt comanda? Cu excepția cazului în care îmi lipsește ceva, îmi imaginez că astfel de cadre utilizate în mod obișnuit pre-ambalate pentru Ubuntu ar aduce o serie de beneficii tangibile unei baze vaste de utilizatori, cum ar fi (dar fără a se limita la):

  • Integrare îmbunătățită cu sistemul gazdă
  • Mai puține configurare și configurare manuale necesare

P.S. Am verificat, de asemenea, magazinul Snap, având în vedere impulsul Canonical către snaps-uri în ultimii ani și, deși par a fi ambalate (Hadoop, Scânteie), ultimele eforturi au fost din 2017 și sunt disponibile doar în canalele instabile beta / edge.

karel avatar
drapel sa
Răspunde asta la întrebarea ta? [De ce depozitele Ubuntu nu au cele mai recente versiuni de software?](https://askubuntu.com/questions/151283/why-dont-the-ubuntu-repositories-have-the-latest-versions-of-software )
Donald Sebastian Leung avatar
drapel cn
Nu, pentru că Hadoop și Spark nu par să se afle în depozitele oficiale Ubuntu _deloc_ (nu am găsit nimic relevant cu `căutarea apt-cache`)
karel avatar
drapel sa
Nici pachetele hadoop și spark snap nu au fost actualizate din 2017. Acesta este ceea ce face din această întrebare fie o întrebare duplicat, fie bazată pe opinii.
Donald Sebastian Leung avatar
drapel cn
Dar apoi (1) m-aș aștepta ca pachetele Snap să urmărească mai îndeaproape în amonte și (2) chiar dacă nu, ar trebui să fie deja stabil până acum
karel avatar
drapel sa
M-aș aștepta și eu la același lucru, deoarece ambele pachete snap sunt întreținute de aceeași persoană, dar nu s-a întâmplat.
Puncte:2
drapel cn

Atât Hadoop, cât și Spark au fost abandonate de la Debian cu ani în urmă, mai ales din cauza lipsei de interes voluntar în întreținerea acestor pachete. Ubuntu primește cele mai multe dintre pachetele sale deb de la Debian, așa că au fost abandonate și din Ubuntu.

Orice voluntar comunitar care dorește invata procesul și contribuiți la efort pot reintroduce pachetele în Debian și, ulterior, vor curge în versiunile viitoare ale Ubuntu. Mai mulți voluntari = software mai mult, mai bun și actualizat.

De asemenea, conform https://wiki.debian.org/Hadoop, dezvoltatorii Hadoop nu au făcut împachetarea și întreținerea deb ușoare pentru voluntarii Debian:

Există o serie de motive pentru aceasta; în special, procesul de construire Hadoop va încărca diferite dependențe prin Maven în loc să utilizeze pachete furnizate de distribuție. Proiectele Java ca acesta nu sunt, din păcate, ușor de împachetat din cauza interdependențelor; și, din păcate, stiva Hadoop este plină de dependențe ciudate

Dacă aceste informații sunt învechite sau incorecte, încă o dată revine voluntarilor comunității să intensifice, să facă corecții și să implementeze modificări. Debian și Ubuntu sunt conduse de voluntari. Mai mulți voluntari = o documentare mai bună.

Donald Sebastian Leung avatar
drapel cn
Mulțumesc, aceasta a fost explicația detaliată pe care o căutam. Este păcat că dezvoltatorii Hadoop nu au facilitat pachetul pentru distribuții precum Debian (și Ubuntu). Poate ar trebui să mă gândesc cândva să contribui :-)

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.