Apache Solr

Beste zelfgehoste zoekmachines

Beste zelfgehoste zoekmachines
Weet je baas dat je een andere baan zoekt?? Heb je je partner verteld over het onvermogen om te beslissen of je wel of geen kinderen wilt?? Weten jullie ouders over je seksuele geaardheid?? Welnu, Google en andere grote zoekmachines wel.

"De meeste gebruikers zoeken op Google terwijl ze zijn ingelogd, dus alle informatie over hun online leven is beschikbaar: YouTube-zoekopdrachten, e-mails en eerdere zoekgeschiedenis", zegt Adam Tauber, de hoofdontwikkelaar van de privacyrespecterende metazoekmachine Searx.

Natuurlijk kun je Tor gebruiken voor anonimiteit en altijd alle sporen van je activiteit verwijderen na elke zoekopdracht, maar dit na elke zoekopdracht zou waarschijnlijk vrij snel oud worden. In plaats daarvan kunt u overwegen een zelf-gehoste zoekmachine te installeren die informatie voor u kan ophalen zonder iets gevoeligs over u te onthullen.

We hebben twee van dergelijke zoekmachines geselecteerd en we introduceren ook drie extra zoekmachines om u te laten zien dat er al uitstekende alternatieven voor propriëtaire zoekmachines zoals Google of Bing bestaan ​​en die gemakkelijker te installeren en te gebruiken zijn dan u zou denken.

1. YaCy

YaCy is een gratis gedistribueerde peer-to-peer-zoekmachine waarvan de kerncomponent is geschreven in Java. Omdat alle YaCy-gebruikers gelijk zijn en omdat de zoekmachine geen zoekopdrachten van gebruikers opslaat, is censuur eenvoudigweg niet mogelijk.

Momenteel indexeert YaCy ongeveer 1.4 miljard documenten in zijn index dankzij de activiteit van meer dan 600 peer-operators die er elke maand aan bijdragen. Ter vergelijking: de Google Search-index bevat honderden miljarden webpagina's en is ruim 100.000.000 gigabyte groot.

Hoewel YaCy nog een lange weg te gaan heeft voordat het kan wedijveren met de grootste gecentraliseerde zoekmachines ter wereld, is het al bruikbaar als een zoekportaal voor privé-intranetten en projectspecifieke applicaties, omdat YaCy als een enkele zoekmachine kan werken zonder te netwerken met andere leeftijdsgenoten.

YaCy kan eenvoudig in elke webpagina worden geïntegreerd dankzij de eenvoudige codefragmenten die moeiteloos kunnen worden gekopieerd en geplakt zonder enige wijziging.

2. Searx

Searx wordt beschreven als een privacy respecterende, hackbare metazoekmachine. Het is beschikbaar onder de GNU Affero General Public License versie 3, en het belangrijkste doel is om de privacy van zijn gebruikers te beschermen door nooit de IP-adressen of zoekgeschiedenis van gebruikers te delen met de zoekmachines waarvan het resultaten verzamelt.

"Bij gebruik van Searx wordt standaard het IP-adres van Searx, een willekeurige User-Agent en een zoekopdracht naar Google gestuurd", legt Adam Tauber, ook bekend als asciimoo, uit hoe zijn metazoekmachine werkt. “Natuurlijk kun je Searx aanpassen om andere extra parameters door te sturen, zoals de zoektaal of het paginanummer van de gevraagde resultatenpagina.”

Searx blokkeert automatisch alle trackingcookies die door de zoekmachines worden geleverd om te voorkomen dat de resultaten op gebruikersprofilering worden gewijzigd, wat het gevolg kan zijn van een zoekmachine die een zoekopdracht probeert te implementeren die is geïndividualiseerd op basis van wat de engine over de gebruiker weet. Searx is 100 procent gratis en iedereen kan het naar behoefte aanpassen. U kunt zelfs de Searx-code gebruiken en de metazoekmachine op uw eigen server uitvoeren, wat zeker alle zorgen over logs zou moeten wegnemen.

3. ElasticSearch

ElasticSearch is een zoekmachine gebaseerd op Lucene, een gratis en open source softwarebibliotheek voor het ophalen van informatie die wordt ondersteund door de Apache Software Foundation en is vrijgegeven onder de Apache Software License.

ElasticSearch biedt een full-text zoekmachine met een HTTP-webinterface. De zoekmachine kan worden gebruikt om allerlei soorten documenten te doorzoeken en kan eenvoudig over meerdere knooppunten worden verdeeld.

Het is mogelijk om een ​​zelf-gehoste zoekmachine te bouwen met ElasticSearch en Docker, en je kunt hier een tutorial vinden die het proces beschrijft.

4. Ambar

Ambar is een open-source documentzoekmachine met veel handige functies. Het ondersteunt automatisch crawlen, taggen en direct zoeken in volledige tekst, om maar een paar voorbeelden te geven. Een van de meest opwindende functies van Ambar is de mogelijkheid om OCR uit te voeren op afbeeldingen en PDF-bestanden. De ondersteunde talen zijn Engels, Duits, Russisch, Italiaans, Frans, Spaans, Pools en Nederlands.

Ambar kan eenvoudig worden geïmplementeerd met een enkel docker-compose-bestand, en u kunt hier leren hoe u dit doet.

5. Apache Solr

Apache Solr is geschreven in Java en is een zoekplatform voor ondernemingen dat zoeken in volledige tekst, het markeren van treffers, gefacetteerd zoeken, realtime indexering, dynamische clustering en vele andere belangrijke functies omvat. Het werd in 2004 gemaakt voor een intern project bij CNET Networks. CNET Networks schonk het in 2006 vriendelijk aan de Apache Software Foundation, waar het in 2007 van incubatiestatus afstudeerde tot een op zichzelf staand topproject.

Tegenwoordig is Solr een zeer betrouwbaar, schaalbaar en fouttolerant zoekplatform voor ondernemingen dat de zoek- en navigatiefuncties van veel van 's werelds grootste internetsites mogelijk maakt, waaronder DuckDuckGo, eHarmony en BestBuy. Jij kan

Hoe YaCy te installeren en configureren

De installatie van YaCy is heel eenvoudig en het duurt maar een paar minuten omdat je geen externe database of webserver hoeft te installeren - YaCy wordt geleverd met alles wat nodig is.

  1. Ga naar de officiële website van YaCy en download het nieuwste pakket voor Linux.
  2. Installeer de OpenJDK 8 runtime-omgeving.
    • Als u een op Debian gebaseerde distributie gebruikt, gebruikt u de volgende opdracht: $ sudo apt-get install openjdk-8-jre
    • Zo niet, volg dan de instructies die specifiek zijn voor uw distributie.
  3. Pak het gedownloade pakket uit naar de locatie van uw voorkeur.
  4. Ga naar de nieuwe map en start de “startYACY.sh"-script in Terminal.
  5. U zou een bevestigingsbericht moeten zien waarin staat dat YaCy is gestart als een daemon

Conclusie

Zoekmachines weten meer over ons dan de meeste mensen willen toegeven. Als u wilt stoppen met het voeden van grote bedrijven met sappige gegevens, kunt u het heft in eigen handen nemen en een zelf-gehoste zoekmachine opzetten om uw privacy te beschermen. Hoewel zelf-gehoste zoekmachines nog een lange weg te gaan hebben om volledig bruikbaar te worden, is het potentieel voor hen om beter te presteren dan Google aanwezig en het vastleggen ervan is slechts een kwestie van meer gebruikers aantrekken.

Cursor springt of beweegt willekeurig tijdens het typen in Windows 10
Als u merkt dat uw muiscursor vanzelf springt of beweegt, automatisch, willekeurig tijdens het typen op een Windows-laptop of -computer, dan kunnen en...
De scrollrichting van de muis en touchpads omkeren in Windows 10
Muis en Touchpads maken computergebruik niet alleen eenvoudig, maar ook efficiënter en minder tijdrovend. We kunnen ons een leven zonder deze apparate...
Hoe de muisaanwijzer en cursorgrootte, kleur en schema op Windows 10 te veranderen
De muisaanwijzer en cursor in Windows 10 zijn zeer belangrijke aspecten van het besturingssysteem. Dit geldt ook voor andere besturingssystemen, dus i...