Project42 site logo - fish from 4, 2 und 1 on pink squares
 Metafer - Filter™ Hilfe Förderverein Projekt42 e.V.
  Home > NeedfulThings > Metafer > MetaferFilterHelp.html Rev.: 3-1-1
Select language Previous (inactive) Up (inactive) Next (inactive) Find similar - global (inactive) Find similar - in Project42 (inactive) Less (inactive) Summarize page - dynamic (inactive) More (inactive) Page-Spectrum (inactive) Page as PDF document (inactive) Create page for printing (inactive) Help - for current page (inactive) Help - for Project42 pages

 
Layout image (ignore)
Metafer - Filter™ Hilfe
Navigation
I42.gif Welcome
I42.gif Home
I42.gif Intro
IWorld.gif Fantasie-Universe
IHammer.gif Projects
IHammer.gif Needful-Things
   IHammer.gif Metafer
     IHammer.gif Metafer-Summarizer
     IHammer.gif Metafer-Theme
     IHammer.gif Metafer-Filter
     IHammer.gif Metafer-Search
     IHammer.gif Metafer-Indexer
     IHammer.gif Metafer-Categorizer
IBooks.gif Literature
IBook.gif Dictionary
IPeople.gif Organization
ISmily.gif Quickies
INote.gif Status

Language

Belgian /be/ (flemish) Dansk /da/ (danish) Deutsch /de/ (german) English /en/ (english) Español /es/ (spanish) Esperanto /eo/ (esperanto) Français /fr/ (french) Hellas /gr/ (greek) Hrvatski /hr/ (croatian) Italiano /it/ (italian) Magyar /hu/ (hungarian) Nederlands /nl/ (dutch) Norsk /no/ (norwegian) Polski /pl/ (polish) Portuguese /pt/ (portuguese) Românã /ro/ (romanian) Русский /ru/ (russian) Suomi /fi/ (finnish) Svenska /sv/ (swedish) Türkçe /tr/ (turkey) Layout image (ignore) عربية /ar/ (arabic) 中文[GB] /zh-cn/ (chinese-[GB]) 中文[Big5] /zh-tw/ (chinese-[Big5]) 日本語 /ja/ (japanese) 한국어 /ko/ (korean)

Der Metafer-Filter erstellt eine Zusammenfassung Ihres Textes auf der Basis eines zweiten Textes, d.h. er "filtert" quasi das worum es im zweiten Text geht aus dem ersten heraus. Geben Sie einfach die URL Ihres Textes an, oder fügen Sie Ihren Text in die Textbox ein. Wählen Sie dann einen der Beispiel-Filter (mit den Themen unserer Intro-Seiten) aus oder geben Sie selbst einen eigenen Text zur Filterung vor. Die Zusammenfassung Ihres Textes wird bezogen auf den gewählten Filtertext erstellt. Das heißt daß die Sätze gefunden werden die am besten dem Inhalt des gesamten Filtertextes entsprechen.

Beschreibung der einzelnen Eingabefelder:


Komprimieren auf:
Sätze Prozent

Mit diesem Feld können Sie die Länge der Ausgabe des Metafer-Summarizer beeinflussen. Entweder Sie geben die maximale Zahl der Sätze ein, nach denen Summarizer die Ausgabe abbrechen soll oder Sie geben die Prozentzahl des Gesamttextes vor, die Sie lesen wollen. Sie können einfach durch klicken auf die aktive Fläche des Radio-Knopfes zwischen der Zahl der Sätze und Prozent umschalten.

Die Zahl der Sätze kann von 1 bis 999 gewählt werden. Bei einer Eingabe von 0 werden alle Sätze aufgelistet, was vor allem im Zusammenhang mir der "Relevanz-Option" interessant ist, bei der die errechnete Satzrelevanz relativ zum Dokument in Prozent angezeigt wird.

Im Falle einer Prozentangabe reicht der erlaubte Bereich natürlich nur von 1% bis 100%.

Die Voreinstellung ist maximal 3 Sätze, die durchaus auch bei längeren Dokumenten ausreichend sein kann um festzustellen, ob einem der Inhalt eines Dokuments interessiert.


Minimale Ähnlichkeit:
% (-100%..100%)

Mit diesem Feld können Sie die minimale Ähnlichkeit des Spektrums aller auszugebenden Sätze relativ zum Spektrum des Dokuments festlegen. Dies ist eine Option, die erst dann sinnvoll zur Geltung kommt, wenn sie in Verbindung mit der obigen Option zur Eingabe von 0 für die Satzzahl (= keine Beschränkung der Satzzahl) kombiniert wird. Die Ausgabe wird damit erst dann abgebrochen, wenn keine Sätze oberhalb der minimalen Ähnlichkeit mehr im Dokument gefunden werden.

Die Angabe der Ähnlichkeit erfolgt je nach Anwendung entweder wie gewohnt von 0 bis 100 Prozent oder in Zusammenhang mit einem Referenzdokument etwas ungewohnt von -100 bis +100 in Prozent. Warum ist das notwendig?

Enthält ein Dokument nur einen Satz, so ist die Ähnlichkeit dieses Satzes zum Dokument natürlich 100%. Ein Satz im Dokument, dessen Spektrum nun gerade noch etwas ähnlich zum Spektrum des Dokuments ist, hat per Definition eine Satz-Ahnlichkeit von 0%. Eine negative Satz-Ähnlichkeit wäre also in der regulären Anwendung der Zusammenfassung von einem Dokument in der Tat nicht notwendig, die Angabe der Ähnlichkeit erfolgt hier wie üblich von 0 bis +100 in Prozent.

Die Eingabe einer negativen Satz-Ähnlichkeit von -100% bis -1% wird jedoch benötigt, wenn ein Dokument auf der Basis eines Referenzdokumentes. Hier ist es sehr wohl möglich (bzw. eher die Regel), das ein Dokument Sätze enthält, die eben von "gerade nichts mehr" bis "absolut nichts mehr" mit dem Referenzdokument zu tun haben. Ein Satz in einem Dokument, der also am wenigsten Ähnlichkeit mit dem Referenzdokument aufweist, hat per Definition die "Satz-Unähnlichkeit" von 100 Pozent, oder eben eine (fiktive) Satz-Ähnlichkeit von -100 Prozent (in der Praxis werden jedoch "Unähnlichkeiten" von weniger als -30% zu einem sinnvollen Ergebnis nicht mehr viel beitragen).

Umgekehrt kann es in seltenen Fällen jedoch sehr wohl auch vorkommen, das ein Satz in einem Referenzdokument eine höhere (!) Übereinstimmung mit dem Spektrum des Dokuments zeigt, als jeder einzelne Satz im Dokument selbst. In diesem Fall errechnet sich für diesen Satz eine (fiktive) Ähnlichkeit von größer 100 Prozent (z.b. 125%). In diesem Fall beschreibt dieser Satz im Referenzdokument einfach den Inhalt des Dokuments besser, als jeder einzelne Satz im Dokument selbst (was im ungünstigsten Fall durchaus einiges über die Qualität des Dokuments aussagen kann ...)

Die Voreinstellung ist 0 Prozent Ähnlichkeit, da für ein einzelnes Dokument der am wenigsten relevante Satz mit 0% natürlich immer noch sicher enthalten ist. Bei einer höheren Angabe von z.B. 50% werden jedoch in Verbindung mit einem Referenzdokument unter Umständen gar keine Sätze mehr ausgegeben, einfach weil kein einziger Satz des Dokuments genügend Ähnlichkeit mit dem Referenzdokument besitzt. Diese Funktionalität läßt sich hervorragend zum Filtern und Finden interessanter Dokumente einsetzen, denn nur diese enthalten in der Ausgabe Sätze, die mindestens die geforderte Ähnlichkeit aufweisen.


Sortierung nach:
Relevanz Original

Mit diesem Schalter können Sie angeben, ob die Ausgabe der gefundenen Sätze in der Reihenfolge ihrer Relevanz, oder in der ursprünglichen Reihenfolge im Dokument erfolgen soll. Eine Sortierung nach Relevanz ist angebracht, wenn die wichtigsten Sätze des Dokuments zuerst ausgegeben werden sollen. Eine Sortierung wie im Original ist sinnvoll, wenn von einem längeren Dokument direkt eine (beliebig) verkürzte Fassung erzeugt werden soll und die Satzanordnung unverändert bleiben soll, damit der Lesefluß soweit möglich nicht gestört wird.

Bei einer Sortierung nach Relevanz wird zusätzlich zu jedem Satz ein ermittelter Prozentwert, die relative Relevanz, ausgegeben. Dies ist zum einen hilfreich, um sich einen Überblick über die Unterschied in der Bewertung von Sätzen zu verschaffen und zum anderen um die Qualität der Ausgabe besser beurteilen zu können, d.h. dem System quasi "auf die Finger zu schauen".

Die Voreinstellung ist Sortierung nach Relevanz.

Auch bei dieser Sortierung wird der Lesefluß bei den meisten Dokumenten überraschenderweise nicht oder nur wenig unterbrochen. Es ist im Gegenteil höchst interessant (und manchmal auch recht überraschend), seine eigenen Dokumente unter dem Blickwinkel der "Beurteilung" des Systems zu lesen.


Bitte ggf. Option wählen

Bitte ggf. Option wählen

Mit dem Knopf "Metafer - Filter starten" übermitteln Sie unserem Server das Formular mit den von Ihnen gemachten Einstellungen und selbstverständlich Ihrem Text (oder den Verweis darauf über seine URL) zur Filterung (bzw. Zusammenfassung mit Referenzdokument).

Bitte beachten Sie dabei unbedingt, daß die Übertragung der Daten aus diesem Formular zu unserem Server derzeit unverschlüsselt abläuft. Sie sollten daher auf keinen Fall eigene sensible Dokumente (die z.B. Konto- oder Kreditkarteninformationen enthalten könnten) durch dieses (oder ein anderes ungeschütztes) Formular über das Internet an unsere (oder andere) Server übermitteln.

Liegt kein Fehler in der Eingabe vor, erstellt unser Server daraufhin eine Zusammenfassung Ihres Textes (ggf. mit Referenz) und übermittelt Ihrem Webbrowser das Ergebnis in Form einer (dynamisch generierten) HTML-Seite.


Der Knopf "Formular zurücksetzen":

Mit dem Knopf "Formular zurücksetzen" können Sie alle von Ihnen vorgenommenen Änderungen an Einstellungen oder Feldinhalten dieses Formulars wieder rückgängig machen. Das Formular wird auf seine Voreinstellungen zurückgesetzt, was effektiv einem Neuladen der Formularseite entspricht, aber wesentlich schneller ausgeführt wird.

Der Link "Hilfe !":

Mit dem Link "Hilfe !" haben Sie diese Seite (bzw. dieses Formular) aufgerufen. Alle weiteren Links auf dieser Seite dienen der üblichen Navigation auf unserem Server, z.B. zurück zu den Metafer-Summarizer Original-Formularen:

Zum Metafer-Summarizer
Zum Metafer-Summarizer mit Referenz (vertikale Formularanordnung)
Zurück zu Metafer-Filter


[Home] [Metafer]
[Home] [Intro] [Fantasie-Universe] [Projects] [Needful-Things] [Literature] [Dictionary] [Organization] [Quickies] [Status]

Valid HTML 4.01! Viewable With Any Browser! Erstellt: Christian Wolf   Geändert: Peter Linssen
Letzte Änderung: Rev.: 3-1-1 Datum: 2000-12-11 21:34:33 GMT