Organisation eines Thesaurus für die Unterstützung der mehrsprachigen Suche in einer bibliographischen Datenbank im Bereich Planen und Bauen

Das Problem der mehrsprachigen Suche gewinnt in der letzten Zeit immer mehr an Bedeutung, da viele nützliche Fachinformationen in der Welt in verschiedenen Sprachen publiziert werden. RSWBPlus ist eine bibliographische Datenbank zum Nachweis der Fachliteratur im Bereich Planen und Bauen, welche  deu...

Full description

Bibliographic Details
Main Author: Dimitri Busch
Format: Article
Language:deu
Published: Verein Deutscher Bibliothekarinnen und Bibliothekare (VDB) 2016-12-01
Series:o-bib. Das offene Bibliotheksjournal
Subjects:
Online Access:https://www.o-bib.de/article/view/5086
id doaj-526188c8dfc64a319af186062220066e
record_format Article
spelling doaj-526188c8dfc64a319af186062220066e2020-11-24T22:32:07ZdeuVerein Deutscher Bibliothekarinnen und Bibliothekare (VDB)o-bib. Das offene Bibliotheksjournal2363-98142016-12-013420221610.5282/o-bib/2016H4S202-2164971Organisation eines Thesaurus für die Unterstützung der mehrsprachigen Suche in einer bibliographischen Datenbank im Bereich Planen und BauenDimitri Busch0Fraunhofer-Informationszentrum Raum und Bau (IRB)Das Problem der mehrsprachigen Suche gewinnt in der letzten Zeit immer mehr an Bedeutung, da viele nützliche Fachinformationen in der Welt in verschiedenen Sprachen publiziert werden. RSWBPlus ist eine bibliographische Datenbank zum Nachweis der Fachliteratur im Bereich Planen und Bauen, welche  deutsch- und englischsprachige Metadaten-Einträge enthält. Bis vor Kurzem war es problematisch Einträge zu finden, deren Sprache sich von der Anfragesprache unterschied. Zum Beispiel fand man auf deutschsprachige Anfragen nur deutschsprachige Einträge, obwohl die Datenbank auch potenziell nützliche englischsprachige Einträge enthielt. Um das Problem zu lösen, wurde nach einer Untersuchung bestehender Ansätze, die RSWBPlus weiterentwickelt, um eine mehrsprachige (sprachübergreifende) Suche zu unterstützen, welche unter Einbeziehung eines zweisprachigen begriffbasierten Thesaurus erfolgt. Der Thesaurus wurde aus bereits bestehenden Thesauri automatisch gebildet. Die Einträge der Quell-Thesauri wurden in SKOS-Format (Simple Knowledge Organisation System) umgewandelt, automatisch miteinander vereinigt und schließlich in einen Ziel-Thesaurus eingespielt, der ebenfalls in SKOS geführt wird. Für den Zugriff zum Ziel-Thesaurus werden Apache Jena und MS SQL Server verwendet. Bei der mehrsprachigen Suche werden Terme der Anfrage durch entsprechende Übersetzungen und Synonyme in Deutsch und Englisch erweitert. Die Erweiterung der Suchterme kann sowohl in der Laufzeit, als auch halbautomatisch erfolgen. Das verbesserte Recherchesystem kann insbesondere deutschsprachigen Benutzern helfen, relevante englischsprachige Einträge zu finden. Die Verwendung vom SKOS erhöht die Interoperabilität der Thesauri, vereinfacht das Bilden des Ziel-Thesaurus und den Zugriff zu seinen Einträgen.   In recent times, the problem of multi-lingual search is gaining more and more importance, because a lot of useful specialized information are published in several languages. RSWBPlus is a bibliographic database which includes German and English metadata entries in the field of construction and planning. Until recently it was difficult to find entries whose language differed from the query language. For example, German queries found only German entries, although the database also contained potentially useful English entries. After an investigation of existing approaches, the RSWBPlus was improved to support cross-language information retrieval, which is carried out with the involvement of a bilingual concept-based thesaurus. The thesaurus has been automatically generated from existing thesauri. The entries in the source thesauri were converted in SKOS format (Simple Knowledge Organization System), automatically merged and finally recorded in a target thesaurus, which also was saved in SKOS format. To access the target thesaurus Apache Jena and MS SQL Server are used. In the multilingual retrieval, query terms are extended by appropriate translations and synonyms in English and German. The expansion of the search terms can be carried out both semi-automatically and in the runtime. The improved retrieval system can especially help German users to find relevant English entries. The use of SKOS format increases interoperability of thesauri, simplifies the building of the target thesaurus and the access to its entries.https://www.o-bib.de/article/view/5086Mehrsprachige SucheSprachübergreifende SucheInformation RetrievalThesaurusOrdnungssystemLiteraturdokumentation
collection DOAJ
language deu
format Article
sources DOAJ
author Dimitri Busch
spellingShingle Dimitri Busch
Organisation eines Thesaurus für die Unterstützung der mehrsprachigen Suche in einer bibliographischen Datenbank im Bereich Planen und Bauen
o-bib. Das offene Bibliotheksjournal
Mehrsprachige Suche
Sprachübergreifende Suche
Information Retrieval
Thesaurus
Ordnungssystem
Literaturdokumentation
author_facet Dimitri Busch
author_sort Dimitri Busch
title Organisation eines Thesaurus für die Unterstützung der mehrsprachigen Suche in einer bibliographischen Datenbank im Bereich Planen und Bauen
title_short Organisation eines Thesaurus für die Unterstützung der mehrsprachigen Suche in einer bibliographischen Datenbank im Bereich Planen und Bauen
title_full Organisation eines Thesaurus für die Unterstützung der mehrsprachigen Suche in einer bibliographischen Datenbank im Bereich Planen und Bauen
title_fullStr Organisation eines Thesaurus für die Unterstützung der mehrsprachigen Suche in einer bibliographischen Datenbank im Bereich Planen und Bauen
title_full_unstemmed Organisation eines Thesaurus für die Unterstützung der mehrsprachigen Suche in einer bibliographischen Datenbank im Bereich Planen und Bauen
title_sort organisation eines thesaurus für die unterstützung der mehrsprachigen suche in einer bibliographischen datenbank im bereich planen und bauen
publisher Verein Deutscher Bibliothekarinnen und Bibliothekare (VDB)
series o-bib. Das offene Bibliotheksjournal
issn 2363-9814
publishDate 2016-12-01
description Das Problem der mehrsprachigen Suche gewinnt in der letzten Zeit immer mehr an Bedeutung, da viele nützliche Fachinformationen in der Welt in verschiedenen Sprachen publiziert werden. RSWBPlus ist eine bibliographische Datenbank zum Nachweis der Fachliteratur im Bereich Planen und Bauen, welche  deutsch- und englischsprachige Metadaten-Einträge enthält. Bis vor Kurzem war es problematisch Einträge zu finden, deren Sprache sich von der Anfragesprache unterschied. Zum Beispiel fand man auf deutschsprachige Anfragen nur deutschsprachige Einträge, obwohl die Datenbank auch potenziell nützliche englischsprachige Einträge enthielt. Um das Problem zu lösen, wurde nach einer Untersuchung bestehender Ansätze, die RSWBPlus weiterentwickelt, um eine mehrsprachige (sprachübergreifende) Suche zu unterstützen, welche unter Einbeziehung eines zweisprachigen begriffbasierten Thesaurus erfolgt. Der Thesaurus wurde aus bereits bestehenden Thesauri automatisch gebildet. Die Einträge der Quell-Thesauri wurden in SKOS-Format (Simple Knowledge Organisation System) umgewandelt, automatisch miteinander vereinigt und schließlich in einen Ziel-Thesaurus eingespielt, der ebenfalls in SKOS geführt wird. Für den Zugriff zum Ziel-Thesaurus werden Apache Jena und MS SQL Server verwendet. Bei der mehrsprachigen Suche werden Terme der Anfrage durch entsprechende Übersetzungen und Synonyme in Deutsch und Englisch erweitert. Die Erweiterung der Suchterme kann sowohl in der Laufzeit, als auch halbautomatisch erfolgen. Das verbesserte Recherchesystem kann insbesondere deutschsprachigen Benutzern helfen, relevante englischsprachige Einträge zu finden. Die Verwendung vom SKOS erhöht die Interoperabilität der Thesauri, vereinfacht das Bilden des Ziel-Thesaurus und den Zugriff zu seinen Einträgen.   In recent times, the problem of multi-lingual search is gaining more and more importance, because a lot of useful specialized information are published in several languages. RSWBPlus is a bibliographic database which includes German and English metadata entries in the field of construction and planning. Until recently it was difficult to find entries whose language differed from the query language. For example, German queries found only German entries, although the database also contained potentially useful English entries. After an investigation of existing approaches, the RSWBPlus was improved to support cross-language information retrieval, which is carried out with the involvement of a bilingual concept-based thesaurus. The thesaurus has been automatically generated from existing thesauri. The entries in the source thesauri were converted in SKOS format (Simple Knowledge Organization System), automatically merged and finally recorded in a target thesaurus, which also was saved in SKOS format. To access the target thesaurus Apache Jena and MS SQL Server are used. In the multilingual retrieval, query terms are extended by appropriate translations and synonyms in English and German. The expansion of the search terms can be carried out both semi-automatically and in the runtime. The improved retrieval system can especially help German users to find relevant English entries. The use of SKOS format increases interoperability of thesauri, simplifies the building of the target thesaurus and the access to its entries.
topic Mehrsprachige Suche
Sprachübergreifende Suche
Information Retrieval
Thesaurus
Ordnungssystem
Literaturdokumentation
url https://www.o-bib.de/article/view/5086
work_keys_str_mv AT dimitribusch organisationeinesthesaurusfurdieunterstutzungdermehrsprachigensucheineinerbibliographischendatenbankimbereichplanenundbauen
_version_ 1725734996955627520