8 Samoobslužný výkonný vyhledávací 🔍 Software pro váš produkt

Zdá se to skličující, ale přidání výkonné vyhledávací funkce do vaší aplikace není složité ani časově náročné. Zde je několik solidních doporučení!

Zatímco mnoho technologií zapůsobilo v posledních 2-3 desetiletích, hledání patří mezi velmi málo, které se staly nedílnou součástí našich životů. Je všude – na stránkách elektronického obchodování, na blozích, ve znalostních databázích a dalších – ne proto, že vyhledávací pole a ikona vypadají skvěle, ale protože dělá něco, co je zoufale potřeba.

Co uděláte, pokud podnikáte a hledáte dobré řešení pro vyhledávání nebo jste unaveni z toho stávajícího?

Naštěstí nemusíte platit směšné licenční poplatky, ani nemusíte udržovat tým 20 vývojářů a systémových administrátorů. Dnes mám několik doporučení pro vyhledávače, které lze nainstalovat a integrovat během okamžiku, zejména malými podniky s vývojářskými týmy o velikosti 1-2.

MeiliSearch

Jedním z nejlepších a nejhodnotnějších vyhledávačů, se kterými se můžete setkat, je MeiliSearch.

Co mě tedy nutí zařadit MeiliSearch mezi svá nejlepší doporučení?

Tady to jde.

Open Source

Veškerý zdrojový kód pohánějící MeiliSearch je volně dostupný na GitHubu. To znamená, že vývojáři mohou sami zkoumat jakoukoli část kódu. Na oplátku si podniky mohou být jisti kvalitou a záměrem (například žádná zadní vrátka nebo skenery v programu). A znalí vývojáři samozřejmě mohou pomoci technologii ještě více vylepšit.

Skvělé UX

MeiliSearch nemá složitá pravidla (jako „a – b“ znamená a, ale ne b). Jednoduše zadejte vyhledávací dotaz přirozeně a výsledky se začnou plynule zobrazovat. Motor je vysoce tolerantní a vstřícný a poskytuje přesné výsledky, i když jsou použity překlepy nebo synonyma. Podporuje také více jazyků.

Skvělý DevEx

Vývojáři budou milovat MeiliSearch! Je to nejen přizpůsobitelné a škálovatelné, ale také rozhraní jako REST API! Dokumentace je také vynikající a kompletní. I když je volání HTTP v jakémkoli jazyce triviální, pro ty, kteří spěchají, jsou uvedeny příklady z pěti jazyků (JavaScript, Ruby, Python, Golang a PHP).

Jednoduchá vyhledávací řešení by se měla snadno používat a nastavovat. MeiliSearch jako takový kontroluje všechna políčka! Až budete spokojeni s pokračováním, spusťte to na DigitalOcean jedním kliknutím.

Solr

Solr, součást projektu Apache, existuje již několik let. Je postaven na známé a vysoce spolehlivé knihovně Lucene, která také pohání oblíbené vyhledávací řešení zvané ElasticSearch. To vše znamená, že Solr patří k nejvýkonnějším, škálovatelným, standardům vyhovujícím, funkčně bohatým a nejdůvěryhodnějším vyhledávacím řešením.

Používají ho giganti jako Disney, eBay, Netflix, Zappos a BestBuy. To však neznamená, že nemůžete spustit menší, jednodušší instalaci (řekněme na jednom počítači, žádné škálování, žádné převzetí služeb při selhání – dobře, někdy je to v pořádku) a využít tohoto mocného zařízení zvaného Solr.

Proč tedy používat Solr?

Zde je několik skvělých důvodů.

Přesné a výkonné

Solr patří mezi nejpřesnější, nejschopnější a nejvýkonnější vyhledávací systémy na světě. Navíc je to open-source, což vysvětluje, proč se k němu velká jména (jak již bylo zmíněno dříve) dostala. Jeho schopnost strávit dokumenty a odpovídat na vyhledávací dotazy je bezkonkurenční.

Jednoduchá instalace a údržba

Instalace Solr je stejně jednoduchá jako dekomprimace a spuštění programu. U jednoduchých jednostrojových systémů není nutná žádná složitá údržba; sledujte využití paměti RAM, protože vyhledávací řešení obecně a technologie založené na Javě zvláště mohou být velmi náročné na RAM (protože uchovávají nebo se snaží uchovávat vše v paměti RAM, aby poskytovaly rychlé čtení/zápis).

administrátorská lišta

Solr je dodáván s administrátorským panelem, který umožňuje vizuální sledování a konfiguraci. S trochou triviálního tréninku se i nevývojáři mohou naučit číst klíčové tabulky. V tomto seznamu není mnoho vyhledávacích řešení vybaveno funkcemi, jako je tato.

Zdroj obrázků: Oficiální stránky

Řízené API, vyhovující standardům

Solr poskytuje výsledkové rozhraní v rozhraní API, které zvládne více formátů — JSON, CSV, XML a binární. Vydává monitorovací data podle standardu JMX, což je obrovská výhoda pro vývojáře v Javě.

  Jak vrátit aplikaci zpět na domovskou obrazovku na iPhone

Ve prospěch Solra by se toho dalo říct mnohem víc, ale pokusit se všechno pokrýt nás zavede až na konec času. 😂 Stačí říct, že Solr je špičkové řešení a nikdy s ním neuděláte chybu, bez ohledu na to, s jakým typem dat pracujete.

Elasticsearch

Elasticsearch byl a pravděpodobně stále je průkopníkem ve volném textovém vyhledávání. Vlastně i dnes, když požádáte programátora nebo správce systému o doporučení ohledně vyhledávačů, Elasticsearch bude s vysokou pravděpodobností jediným jménem, ​​se kterým přijdou. Jistě, v dnešní době značná část doporučí něco jako Algolia, ale už jsme probrali, jak to dopadne. 🤪

Nenechte se zmást tlačítkem „Zahájit bezplatnou zkušební verzi“ na obrázku výše. Zatímco samotná základní technologie Elasticsearch je open source a zdarma, společnost se snaží své úsilí zpeněžit a zaměřit se na podniky. To, co zde vidíte, je tedy ve skutečnosti zkušební verze jejich cloudové služby, která usnadňuje správu Elasticsearch, zejména pokud jsou zapojeny clustery.

Uff, tolik sítí k rozmotání. Pojďme si to zrekapitulovat: Elasticsearch je open source a zdarma a každý si jej může snadno nastavit a používat bez jakýchkoli omezení.

A nyní, jak se dalo očekávat, se pojďme ponořit do důvodů, proč si vybrat Elasticsearch:

  • Vyspělý, bitvami prověřený vyhledávač. To znamená, že mnohem pravděpodobněji najdete řešení, pokud narazíte na „podivné“ chyby.
  • Prvotřídní zaměření na shlukování, škálovatelnost a asynchronní zápisy.
  • Přístupné přes jednoduché REST API (což všichni ostatní nakonec zkopírovali).
  • Orientovaný na dokumenty, ale v případě potřeby podporuje schéma.
  • Šíleně rychlé a přesné výsledky. Nastavitelná rychlost vyhledávání.
  • Hvězdná dokumentace, v množství i užitečnosti.
  • Kompletní cloudová platforma pro vyhledávání a analýzu (zásobník ELK), pokud chcete platit za pohodlí.

Jediné, co bych měl proti Elasticsearch, je masivní spotřeba RAM. Myslím tím, že jako konzultanti je dost těžké přesvědčit klienty, aby investovali do serveru stojícího 20 $ měsíčně, což bohužel není ani zdaleka to, co Elasticsearch požaduje.

Pokud se chcete naučit Elasticsearch, podívejte se na tento kurz Udemy.

Typový smysl

Typesense je lehký, přímočarý, ale výkonný vyhledávač. Ti, kteří hledají užitečnost a jednoduchost, by to měli určitě vyzkoušet.

Jedna z nejlepších věcí na Typesense je, že si to můžete vyzkoušet přímo na jejich webových stránkách. To může ušetřit frustraci a čas v případech, kdy vše nastavíte a vyzkoušíte API. . . jen abyste zjistili, že jedna nebo více funkcí nefunguje tak, jak byste si přáli.

To neznamená, že by mohly být chyby v motoru; jde jen o to, že představa motoru o něčem nemusí být vaše preference, nebo může být zcela v rozporu s vaší obchodní doménou. Překlepy, speciální symboly, synonyma a další . . . výsledky, které engine vyhodí, můžete zkontrolovat přímo na domovské stránce (k tomu používají databázi knih).

Jak vidíte, tato sekce je hned pod tou nejvyšší. Do vyhledávacího pole jsem zadal dotaz „tra“ a níže vidím odpovídající výsledky z databáze knih (a také metadata – celkové výsledky, aktuální stránku atd.).

Typesense má co dělat, pokud jde o vybraný vyhledávač:

  • Technologie za tím je plně open source a přívětivá.
  • Snadná konfigurace nastavení HA (High Availability), pokud jej potřebujete.
  • Tolerantní, pokud jde o překlepy a jiný šum ve vyhledávacích dotazech.
  • Pokročilý systém filtrování pro ty, kteří potřebují jemnou kontrolu nad výsledky vyhledávání.
  • Jednoduché REST API, i když s jejich dokumenty budete muset tvrdě pracovat, abyste je našli!
  • Klienti (SDK) jsou k dispozici pro některé z hlavních jazyků (JavaScript, Python, Ruby a PHP).

A konečně, pokud se vám zdá myšlenka nastavování nových serverů únavná, Typesense má také cloudovou nabídku, kde zřizování trvá jediným kliknutím. Účtování probíhá po hodinách a čtení a zápis se neměří. Upřímně řečeno, řeknu, že je to lepší volba pro většinu podniků, za předpokladu, že si předem vypracovali ceny a zajistili, že jde o čistý zisk.

Sečteno a podtrženo, Typesense dává velký smysl (bez slovní hříčky!), pokud potřebujete něco malého, uhlazeného, ​​přesného a skutečného pracanta.

  Jak používat výzvy s objektivem na Snapchatu

Zvukový

Sonic se pyšní tím, že je alternativou ElasticSaerch, která běží na „několika MB RAM“.

Jak je tohle možné?

O Java Virtual Machine (JVM) je známo, že je velmi náročný na RAM (obecně pouhé spuštění JVM zabere asi 1 GB RAM); Není tedy překvapením, že něco kódovaného v jazyce Rust (který poskytuje plnou kontrolu a bezpečnost paměti pro vývojáře) může běžet stejně rychle a používat jen pár MB RAM.

Uvolněte se, všichni! To je jen maskot projektu.

V době psaní je mezi jeho uživateli uvedeno několik společností, i když jsem si jistý, že existuje několik dalších, které se neobtěžovaly přidat svá jména. Nepamatuji si jak ani přesný časový rámec, ale na Sonic jsem narazil dříve; v té době, i když jsem byl rád, že jsem viděl alternativu s nízkou pamětí, myslel jsem si, že bude potřebovat čas na stabilizaci a odstranění skrytých chyb. No, vypadá to, že víceméně dorazili; Jak populární se Sonic stane, to ukáže jen čas.

Dobře, tak dlouhé přemítání stranou, proč byste měli zvážit použití Sonic pro vaši organizaci/projekt?

Zde je několik důvodů:

  • Extrémně nízká paměťová náročnost, pokud jde o vyhledávače.
  • Knihovny jsou dostupné pro všechny hlavní programovací jazyky. Node, PHP a Rust jsou to, co vydali sami autoři, zatímco jiné vytvořila komunita (radujte se, protože jsou pokryty i exotické tuhé jako Elixir a Nim!).
  • Je podporováno několik jazyků (bylo toho příliš mnoho na počítání, ale myslím, že při psaní je podporováno 40-50 jazyků).
  • Překvapení! Můžete dokonce používat nové jazyky a engine bude fungovat (😂😂), i když přijdete o některé pokročilé funkce, jako jsou zastavovací slova.
  • Velmi rychlý motor. Pokud se podíváte na jejich stránku GitHub, uvidíte, že doby příjmu a vyhledávání byly v několika případech v mikrosekundách! Samozřejmě se jednalo o test na jednom počítači, protože latence sítě nikdy nedovolí, aby čísla byla tak nízká.

Pokud chcete vidět tento motor v akci, přejděte na tento odkaz (jedna z jejich uživatelských společností) a pohrajte si s vyhledávacím polem, které tam vidíte:

Sonic jako vyhledávač má určitá omezení. Vývojáři je otevřeně zdůraznili a diskutovali na své stránce GitHub. Moje rada je důkladně prozkoumat tento seznam a zjistit, že vaše případy použití nejsou společné s jejich doménou. To znamená, že všechno má svá omezení; jen jsou skryty, a tak si to neuvědomíme, dokud není příliš pozdě. Sonic proto považuji za skvělou volbu do vyhledávače.

TNTSearch

Nyní máme na tomto seznamu fascinující záznam. První zajímavostí je, že tento plně funkční a produkčně připravený vyhledávač byl napsán v PHP!

Ano, ze všech možných jazyků PHP. A neříkám to proto, že bych PHP nenáviděl, ale protože je to proces, který má krátkou životnost.

Druhou zajímavostí je jejich licence, alespoň co se psaní týče. Vlastně samotná licence je MIT, takže tam nejsou žádné problémy, ale autoři tento software klasifikují jako PS4Ware; pokud používáte TNTSearch ve výrobě, měli byste jim poslat hru pro PS4! 😂😂 Teď to není povinné, jak naznačuje „mělo by“, ale je to neuvěřitelné vtipné. Také doufám, že to upgradují na licenci PS5, i když je teď příliš brzy.

Každopádně, sám pocházím ze silného prostředí PHP + Laravel, velmi oceňuji snahu těchto kluků. Jejich webové stránky toho moc neříkají, ale zdá se, že naznačují, že jsou to konzultanti, takže vřele doporučuji, abyste se na ně obrátili, pokud máte projekty!

Existují nějaké dobré důvody, proč používat TNTSearch ve vašich projektech?

Ano jsou:

  • Kódováno v PHP, pro PHP, pomocí PHP. Ekosystém PHP potřebuje více specializovaných a vysoce kvalitních řešení, jako je toto.
  • Důležité funkce, jako je fuzzy vyhledávání, geografické vyhledávání a klasifikace textu.
  • Snadná změna indexu vyhledávání, což u mnoha řešení chybí hlavní flexibilita.
  • Stemming, hodnocení BM25 a vlastní tokenizace zajišťují vysokou přesnost.
  • Snadné nasazení – stejně jako jakýkoli jiný balíček Composer!
  Jak nastavit datum vypršení platnosti při sdílení souborů na Disku Google

Zde si můžete ověřit výkon motoru a sami se přesvědčit, jak je rychlý a přesný. Znovu bych zdůraznil aspekt PHP: pokud udržujete projekt PHP, chcete co nejvíce zůstat mezi stěnami PHP (proč? myslet na náklady na rekvalifikaci). A pro takové případy přináší TNTSearch hodnotovou nabídku, která se jen těžko odmítá!

Vespa

Vespa je široká a těžká nabídka. Stejně jako několik dalších položek v tomto seznamu je příliš velký na to, aby se dal zachytit několika slovy. Ale musím to zkusit, tak to udělám. 🙂 Vespa je vyhledávač, jistě, ale používat ho jako obyčejný vyhledávač bude plýtvat jeho potenciálem.

Vespa byla postavena tak, aby zpracovávala nekonečné množství dat (Big Data) a navíc poskytovala funkce založené na strojovém učení a nekonečné možnosti přizpůsobení.

Vespa se staví jako konkurent Elasticsearch a tradičním databázím a poskytuje slušné srovnání toho, co a kdy použít.

Jak vidíte, čím blíže se chcete dostat k operacím založeným na strojovém učení, tím větší smysl dává Vespa. Jako čistý vyhledávač pro malé a střední podniky si nemyslím, že by měl oproti jiným možnostem nějaké výhody.

Nyní, vzhledem k tomu, že neustále generujete obrovské množství dat a chcete zlepšit rozhodování prostřednictvím AI/ML (popis, který dnes vyhovuje mnoha SaaS podnikům), má Vespa velký smysl:

  • Open source: Žádné podivné licence a žádné odchytové smlouvy. A navíc nic, co by se dalo platit, i když vždy zdůrazňuji, že společnosti platí pravidelnou částku za projekty, které nejvíce využívají (i 50 $ měsíčně jim hodně pomůže).
  • V reálném čase: Vespa je skutečně v reálném čase. Nemůže pouze trávit, drtit a vyhledávat data, jak přicházejí; dokonce i jeho konfiguraci lze upravovat za chodu.
  • Škálovatelný a tolerantní: Vespa je v měřítku triviální. Velmi dobře také reaguje na náhlé zmizení uzlů a poskytuje vysokou spolehlivost.
  • Hodnocení a doporučení: Doporučení pro vyhledávání, hodnocení a Vespa lze sloučit se strukturovanými dotazy a poskytovat skutečně přesné výsledky.
  • Bezbolestná AI/ML: Vespa je dodávána s vysoce kvalitními, předem vyškolenými modely ML. K čištění a používání vašich dat nepotřebujete najmout 20 datových vědců.
  • Vlastní zásuvné moduly: Existuje celá sada rozhraní API, která vývojářům pomáhají vytvářet vlastní zásuvné moduly Java, pokud by potřebovali změnit, jak motor funguje.

Vespa je bezpochyby masivní, takže je to jasné pro týmy, které jsou trochu za počáteční úrovní – ať už jde o velikost týmu, technologickou zdatnost, rozpočty infrastruktury, denní objemy dat nebo něco jiného. V tomto segmentu bude Vespa hitem homerun a je vysoce doporučena.

Ambar

U některých podniků již nejsou data vyhledávání úhledně transformována a uložena jako dokumenty JSON; spíše je to nepořádek v pravém slova smyslu — chaotická sbírka všemožných dokumentů, jako jsou Word, PDF, HTML soubory atd. Pokud jste jedním z nich a mysleli jste si, že pro vás není žádná naděje, řekněte ahoj Ambar!

Nejlepší na Ambar je velký typ souborů, se kterými dokáže pracovat:

  • Formáty souborů MS Office (.docx, .xlsx atd.), včetně PowerPoint, Visio a Publisher!
  • Formáty souborů OpenOffice
  • Dokumenty PDF s automatickým OCR použitým k extrahování informací.
  • snímky
  • Formáty e-mailových archivů, jako je PST (ahoj, uživatelé aplikace Outlook!)
  • E-mailové zprávy s přílohami

Ani tady dobroty nekončí. Ambar je schopen pracovat s velkými soubory (přes 30 MB), archivy ZIP a multithreadingem pro plné využití procesoru a rychlejší výsledky. Takže, pokud máte na nějakém disku na zapomenutém serveru dokumenty v hodnotě let, je čas je vrátit a dát vše Ambaru!

Závěr

Hledání 🔎 je mocné, hledání je kouzlo a hledání je všude!

Může se dokonce jednat o černou magii, ale dnes není důvod, proč by její výhody nemohli využívat všichni (samozřejmě s pomocí vývojářů). Od podniků přes jednotlivce až po vlády, vyhledávače v tomto seznamu poskytují nabídku s téměř nulovou námahou s exponenciálními výhodami a dopadem.

Pokračujte a získejte cloudový server a nainstalujte si výše uvedený vyhledávací software, který chcete používat.