Puncte:1

Există vreo modalitate de a utiliza pluginul de ingest attachment cu Elastic App Search

drapel bv

Lucrez la un portal care găzduiește mai multe tipuri de documentație (HTML, PDF, PPTx, DocX) și le face pe toate căutabile într-un singur loc.

Am putea realiza acest lucru folosind „standardul” din cutie ElasticSearch și pluginul Ingest Attachment, dar nu sunt un cercetător al datelor și știu foarte puține despre scrierea interogărilor Elastic, așa că rezultatele căutării noastre nu sunt grozave.

Mi s-a recomandat să folosesc Enterprise App Search în loc să încerc să-mi ajustez interogările de bază, dar s-ar părea că nu pot folosi pluginul de ingest attachment cu el? Ca rezultat, nu pot folosi pur și simplu trimiterea conținutului codificat în base64 către API-ul document și să mă aștept ca conținutul să fie indexat.

Există vreo cale de a ocoli asta? Sau nu aș putea folosi App Search pentru asta??

Puncte:0
drapel bv

Răspunsul la aceasta este extragerea conținutului atașamentului, fie utilizând conducta de atașament, așa cum s-a sugerat în această postare pe blog sau, dacă aveți backend-ul în Java ca mine, puteți utiliza Apache Tika pentru a vă extrage singur conținutul din atașamente.

Am implementat Tika pentru a extrage conținutul HTML (de fapt, este foarte simplu)

static String getContent(String htmlContent) aruncă TikaException, SAXException, IOException {
    InputStream input = new ByteArrayInputStream(htmlContent.getBytes());
    ContentHandler handler = new BodyContentHandler();
    Metadate metadata = metadate new();
    nou HtmlParser().parse(input, handler, metadate, nou ParseContext());
    return handler.toString();
}

Pentru fișierele PDF, foloseam deja Apache PdfBox pentru a extrage alte proprietăți, așa că textul a venit „gratuit”.Același lucru pentru fișierele Office, dar asta necesită Apache Poi.

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.