Ich möchte für ein Projekt eine Volltextindizierung verwenden und bin bei meinen Recherchen auf Lucene von Apache bzw. Solr gestoßen und hoffe, dass sich hier vielleicht irgendjemand damit auskennt, denn anders als bei anderen APIs und Tools bin ich langsam mit meinem Latein am Ende.
Für Lucene gibt es viele schöne Beispiele im Netz zu finden, allerdings hab ich keines entdeckt, das zur aktuellen Version 7.2.1 passt.
Ich hab es nach https://me4bruno.wordpress.com/2013/08/28/lucene-volltextsuche-leicht-gemacht/ versucht, gut, der ist von 2013, aber ich hätte nicht erwartet, dass Lucene in der Zwischenzeit die API offenbar so grundlegend verändert hat, dass ich nicht weiter komme.
Ich konnte meine Daten Indizieren, aber daraus etwas abzurufen war mir nicht möglich.
Ich habe es heute dann mit dem offiziellen Solr-Getting-Started Tutorial versucht:
https://lucene.apache.org/solr/guide/7_2/solr-tutorial.html
Das scheitert am Punkt “Congratulations! Solr is ready for data!” damit, dass mir unter http://localhost:8983/solr “SolrCore Initialization Failures” angezeigt wird. Die Logs unter …\example\cloud\node1\logs (und node2) sind komplett leer und geben somit leider keinen Hinweis auf die Fehlerursache. Die direkte Google-Suche nach dem Fehler lässt doppelte Jars erahnen (nicht der Fall, ich hatte ja auch gerade erst Solr 7.2.1 ausgepackt, was soll da doppelt sein?) oder auf falsch gesetzte Dateien “write-lock” schließen.
Warum funktioniert das frisch heruntergeladene und gerade ausgepackte Tutorial nicht? Unverständlich…
Eigentlich brauche ich auch gar nicht unbedingt Solr. Ich will eigentlich einfach nur zusätzlich zu anderen Suchmöglichkeiten in einer Datenbank auch die Möglichkeit zur Volltextindizierung für bestimmte Dokumente anbieten. Ich hätte nicht gedacht, dass das ganze so dermaßen schwierig an den Start zu bringen ist.
Selbst die Suche nach “Lucene 7.2.1 csv example” oder “Lucene csv example 2018” bzw. “Lucene csv example 2017” bringt nicht so richtig das, was ich mir erhoffe.
Das aktuellste was ich gefunden habe ist noch
“Searching and Indexing With Apache Lucene”
18. Jan. 2017 - Immerhin “Lucene 6.3”
was ich mir aber noch nicht im Detail angeschaut habe.
Andere Dokumentationen sind “updated for Lucene 4” etc.
Die Anleitung von Apache selbst zu Lucene dreht sich leider nur um die Indizierung von einer Reihe von Textdateien, nicht um die einer CSV-Datei (o.ä.).
Ich würde eigentlich das ganze gern in meinen Java-Programmen aufrufen und entsprechende Ergebnisse zu Suchanfragen zurückliefern können. Eigentlich dürfte das ja nicht so schwierig sein und ich hatte erwartet, da spätestens nach einem halben Tag erste Erfolge (laufendes Beispiel) zu haben, leider ist dem nicht so und ich hadere damit schon mehrere Tage herum, was ich als äußerst unbefriedigend empfinde.
Wenn ihr also irgendwelche andere Quellen, Ratschläge oder eigene Erfahrungen habt, nur her damit. Oder falls jemand beim Suchen einfach ein glücklicheres Händchen hat, auch das gern.
Edit: Auch das verlinkte Lucene 6.3 Beispiel scheitert an nicht mehr zu findenen Lucene-Klassen/Methoden…
Edit 2: Nichtmal das was unter https://lucene.apache.org/core/7_2_1/demo/overview-summary.html#overview_description steht, funktioniert so. seufzt Das kann doch alles nicht wahr sein.