Hartman Gids

Thunderstone TEXIS

Bedrijfsgegevens

Naam

Thunderstone TEXIS

Versie en release

TEXIS 6.3

Aantal installaties

Meer dan 1.000

Aantal gebruikers

Meer dan 150.000

Type product

Closed source
Beschrijving Zie de white paper van Thunderstone’s TEXIS.

Roadmap 2009

Thunderstone werkt actief samen met Resellers/ Channel Partners om de wereldwijde implementaties van TEXIS software, Webinator web indexing en retrieval system, Thunderstone Parametric Search Appliances en Thunderstone Search Appliances uit te voeren en te ondersteunen.

Referenties

Bekijk de case studies op: http://www.thunderstone.com/texis/site/pages/Exposition.html.

Inrichten

Mechanisme vergaring content De Texis crawler haalt de inhoud van webpagina’s en slaat alle content als een record op in de Texis database. Deze database wordt de zoekmachine voor de geïndexeerde pagina’s en kan worden doorzocht door Texis SQL SELECT…LIKE statements. Er is voorzien in een generieke web interface. De crawler is in staat om databases en bestandssystemen te crawlen, waarbij de permissie-instellingen worden gerespecteerd. Thunderstone Texis voorziet real-time applicaties met nul-latentie data-invoer, waarmee nieuwe of gewijzigde data direct via het zoeken kan worden gevonden, zonder te wachten op geplande index updates.
Bestandstypen Texis kan content indexeren, raadplegen en opvragen in vrijwel alle gangbare bestandsformaten.
Omgevingen Online catalogi, veilingen, classifieds, geautomatiseerde categorisatie, proces ondersteuning, intelligentie collecties/analyses, risico inventarisatie, kwaliteits-controle, CRM, kennisontsluiting, document en multimedia management, internet publicaties, verticale portals, real-time berichten afhandeling, zoeken op het Internet en nog veel meer.

Indexeren

Zoekresultaat verfijnen Texis kan tekstbestanden opslaan die geografische locaties bevatten en zoekopdrachten uitvoeren die afgeleid zijn van een bepaalde afstand. Texis ondersteunt subzoeken (zoeken binnen zoekresultaten) en metazoeken. Hierbij is een zoekopdracht aan twee of meerdere zoekmachines of zoekcollecties gegeven en vervolgens worden de zoekresultaten gezamenlijk of gecombineerd weergegeven. Texis kan elk document of tekstgedeelte gebruiken als een zoekopdracht naar vergelijkbare records. Texis stelt geen eisen aan de user interface en is ‘neutraal’ wat betreft HTML-opmaak voor de resultaatweergave.
Aantal en relevantie Het zoekalgoritme houdt rekening met woordvolgorde, woorden die dichtbij staan, databasefrequentie, documentfrequentie en de positie in de tekst. Het relatieve belang van deze factoren kan gemakkelijk worden aangepast. Standaard worden de zoekresultaten gepresenteerd in volgorde van relevantie. Het is mogelijk relevantieberekeningsmodellen te onderhouden en aan te passen, tijdelijk op te heffen en individuele zoekopdrachten uit te voeren die voor de instellingen relevante resultaten opleveren.
Spelling en synoniemen De zoekmachine heeft een aanpasbaar vocabulaire van meer dan 250.000 woorden en uitdrukkingen. Met de ‘ApproXimate Pattern Matcher’ kan men verkeerd gespelde woorden en typefouten vinden en zoeken binnen een bepaald percentage van nabijheid voor een ingevoerde string.
Clustering Texis sorteert en groepeert zoekresultaten op elk veld in de data. Texis kan meer dan tienduizenden hits sorteren. Texis en Thunderstone Parametric Search Appliances ondersteunen ’sort by’ en ‘group by’. Men heeft de flexibiliteit om te bepalen hoe je de gebruikers in staat wilt stellen om zoekresultaten te sorteren door middel van vrijwel elke combinatie van gedefinieerde attributen in de index. Daarbij kan elk van de beschikbare velden worden gebruikt om navigatielinks te leveren die gebruikers in staat stellen om door de resultaten te browsen.
Metadata Texis kan metadata gebruiken voor het sorteren en/of groeperen van tekstuele zoekresultaten op basis van alle beschikbare attributen. Thunderstone Texis biedt parametrische zoekmogelijkheden.
Taal en linguïstiek Texis voorziet in de verwerking van woordvervoegingen. Bepaalde aspecten van woordvervoegingen kunnen worden aan- of uitgezet en de regels kunnen worden aangepast. Voor elke taal kunnen vervoegingsregels worden gespecificeerd.

Rapportage

Besturingssysteem Texis draait onder de belangrijkste Unix systemen, OSX en Windows NT/2000/XP. Op Unix gebaseerde systemen als Solaris 2.5+, Linux, Compaq Tru64 (DEC Alpha), FreeBSD, Irix, BSDI, HP-UX, AIX SCO en Unixware worden ondersteund.

Browsers

File-systeem

Texis heeft een blob-type veld dat nuttig is voor het opslaan van afbeeldingen of andere binaire data. In Texis wordt echter contextuele content van elk formaat gewoonlijk in een variable-size varchar veld geplaatst, waardoor superieure tekst indexering wordt gerealiseerd en zoekfunctionaliteiten worden vergeleken met het opslaan van tekst in blobs.

Databases

Doordat Texis zelf een volledige database is, dient het als een krachtige en efficiënte zoekmachine voor content die zich in elke andere database bevindt. Texis wordt gebruikt op websites met doorzoekbare databases waarop tientallen miljoenen grote records staan. Het wordt ingezet bij het doorzoeken van honderden miljoenen records zonder significante complicaties. Thunderstone Texis is de enige relationele database die tekstdocumenten van onbeperkte grootte kan opslaan en doorzoeken binnen standaard database tabellen.

Programmeer­talen

Het TEXIS programma voert bestanden uit die geschreven zijn in Texis Web Script, een krachtige web-server gebaseerde HTML programmeertaal. Het kan worden aangeroepen vanaf de commandoregel of als een CGI-programma van de web server om scripts te draaien. Texis applicaties kunnen ook worden gemaakt met gebruik van een groot aantal andere technologieën.

API

Een C-oproepbare API met vele mogelijkheden is beschikbaar voor speciale gevallen, maar voor de meeste applicaties is de HTTP interface het eenvoudigst in gebruik en bijna net zo snel.

De software van Thunderstone Texis ondersteunt een verscheidenheid aan tools die kunnen worden gebruikt om toegang tot, import in en dataverwerking van de meeste omgevingen mogelijk te maken zonder gebruik te maken van een connector. Thunderstonde levert een SOAP-interface voor het integreren met andere ‘SOAP-achtige’ applicaties/functionaliteiten, alsmede tools die de gebruikers in staat stellen om hun eigen SOAP-integraties te maken. Thunderstone Search Appliances kunnen content in Oracle, MS SQL, Sybase, Postgres, DB2 en Texis crawlen en indexeren. Thunderstone’s Appliances hebben connectoren tot hun beschikking voor Microsoft SharePoint 2003 en 2007, EMC Documentum Content Server, EMC Documentum eRoom, IBM Lotus Notes/Domino 5.x en 6.x en 7.x, IBM Websphere Portal 6.0 WCM, IBM Websphere Portal 6.0 DM, BEA Weblogic Portal 10.0, Hummingbird Document Manager 5.1, SAP KM Portal, Interwoven WorkSite.

Investering

Licentiemodel Enkelvoudige, levenslange licenties (deze leveren vooraf 40-60% besparing op de gehele investering op en kunnen, wanneer wordt vergeleken met de totale kosten voor eigendom van andere producten, nog drastischere jaarlijkse besparingen betekenen).

Texis (en Webinator) licenties zijn geprijsd voor het aantal records in de grootste hoofdindex en het aantal zoekopdrachten per dag over alle indexen. Texis licentie is voor meerdere servers op één enkele locatie. Webinator staat één server per licentie toe.

Licentieprijzen voor Thunderstone Search Appliances en Thunderstone Parametric Search Appliances zijn gebaseerd op het aantal te indexeren documenten.

Thunderstone calculeert op aanvraag alternatieve licentieprijzen voor afwijkende behoeften.

Toelichting leverancier

Thunderstone heeft gelijktijdig research gedaan inhet zoeken van gestructureerde en ongestructureerde data met derelationele database TEXIS, die geoptimaliseerd is voor full-textsearch. Sinds 1981 heeft Thunderstone zijn ongeëvenaardedeskundigheid als leverancier van ‘s werelds meest krachtige,schaalbare en flexibele enterprise search tools ontwikkeld. Geenander bedrijf bezit zoveel kennis en gelegen-heid om een oplossing televeren: robuust, betrouwbaar en goed uitgerust.

Thunderstone TEXIS, het innovatieveontwikkelplatform achter de gehele lijn van enterprise searchproducten van Thunderstone, is de enige volledig geïntegreerdeSQL RDBMS die op intelligente wijze opdrachten verwerkt en databasesbeheert die natuurlijke taalteksten, standaard data types,geografische informatie, afbeeldingen, video, audio en andere zwaredata bevatten. Texis is de perfecte oplossing voor het zoeken ingrootschalige, bedrijfskritische en/ of complexe informatiebronnen opbasis van full-text en het zoeken in traditioneel gestructureerdedatabases.

Thunderstone Texis voorziet in een ideaalontwikkelplatform voor snel toepasbare, op maat gemaakte applicatiesdie zowel om een ongestructureerde als een gestructureerde manier vanzoeken vragen:

  • Online catalogi bevatten ongestructureerde teksten (productnaam, omschrijving) en gestructureerde content (stijl, maat, prijs, voorraad beschikbaarheid). Gebruikers verwachten de mogelijkheid om te zoeken op itemomschrijving, te navigeren per prijsrange of beide tegelijk.
  • Kennismanagement systemen vragen om efficiënte en veilige bedrijfsbrede informatiewinning uit meerdere bronnen die verschillende type gebruikers bedienen. Gebruikers willen allemaal dynamische, contextgevoelige overzichten van gedefinieerde content (gestructureerde data) met de mogelijkheid om middels full-text zoeken de resultaten te verfijnen.
  • Texis heeft een consultant voor Thunderstone oplossingen ingezet in een ‘brute kracht’ full-text zoekscenario voor het Amerikaanse Ministerie van Defensie, waarbij Thunderstone Texis wordt gebruikt om de inhoud van een enorme Oracle database te doorzoeken in een poging tot counter terrorisme. Texis wordt gebruikt als een toevoeging op Oracle full-text zoeken vanwege de mogelijkheid om op te schalen terwijl de superieure prestatie in zowel opnamehoeveelheid en zoeken gehandhaafd blijft. Thunderstone Texis stelt deze klant in staat om een index van 20 terabyte te doorzoeken, waarin 70-80 miljoen nieuwe records per uur worden opgenomen en zoekresultaten in minder dan 10 seconden worden geretourneerd.
  • Een Fortune top 20 klant gebruikt Thunderstone Texis als een zoekplatform voor “het op één na grootste kennismanagement systeem dat momenteel is ingezet bij welk bedrijf dan ook. De applicatie behelst kennis, mensen en processen en het wordt mondiaal gebruikt binnen de organisatie om meer dan 30 terabyte te doorzoeken. Gebruikers benaderen de applicatie meer dan 20 miljoen keer per dag, waarbij informatie van de organisatie over de gehele wereld wordt opgevraagd en gedeeld. De applicatie is de meest gebruikte bedrijfsmatige IT-bron op e-mail na.”

Thunderstone Texis laat gebruikers enontwikkelaars hun eigen unieke kennis en expertise inbedden in opmaat gemaakte zoekoplossingen die eenvoudig zijn te integreren metandere applicaties.

Reacties

Geplaatst door Peter Thusat op 23-06-2010

http://www.thunderstone.com/site/cases/overview-texis-whitepaper.pdf The URL for the Texis overview white paper should have all lowercase letters.

Geplaatst door Erik M. Hartman op 12-07-2010

Peter, thanks for this correction. It's fixed now!

Reactieformulier

Naam
E-mail adres (wordt niet gepubliceerd)
Website
Reactie

Bestel de HartmanGIDS MobileMojo Xillio Sitecore EPiServer Kentico Q42 IPROFS SDL Tridion Xopus Waxtrapp Erik Hartman Communicatie Allesovercontentmanagement.nl

Erik Hartman Communicatie

voor al uw advies over een optimale communicatie- en informatiestrategie :: www.hartman-communicatie.nl

Alles over Content Management

de bron voor nieuws en achtergronden over online communicatie en informatiemanagement :: http://www.allesovercontentmanagement.nl

HartmanEVENT

leer alles over succesvol content management van de experts en de praktijkcases :: www.hartmanevent.nl

Web Analytics