Wer Internetanzeigen für Wohnungen erstellt, kennt die unliebsame Aufgabe, alle Objekte und deren Lage in ganzen Sätzen zu beschreiben. Auch bei unseren Kunden ist das Verfassen dieser Anzeigentexte sehr unbeliebt: Größtenteils bestehen sie nur aus ein bis zwei Sätzen. Für die Lagebeschreibungen haben wir bereits einen selbst entwickelten Generator im Einsatz, der auf Basis der Points of Interest in unserem Kartenmaterial einen Text erstellt. Als brandneues Feature bieten wir nun auch das Generieren von Anzeigentiteln und Objektbeschreibungstexten an.
Das Erfolgsrezept für KI-generierte Internetanzeigen
Man nehme: eine generative KI auf Basis von Large Language Models, gute Prompts und die bereits hinterlegten Objektinformationen – und fertig ist die passende Objektbeschreibung mitsamt Anzeigentitel. Lassen Sie uns die einzelnen Zutaten im Detail durchgehen.
Zutat Nr. 1: Die richtige KI
Eine generative Künstliche Intelligenz (KI) ist ein System, das darauf ausgelegt ist, neue Inhalte in Form von Text, Bild, Audio oder Video zu erstellen. Die aktuell bekannteste generative KI ist ChatGPT, die für die Texterstellung entwickelt wurde. Die führenden textbasierten KIs verwenden so genannte Large Language Models (LLMs), die natürliche Sprache verstehen, verarbeiten und generieren. Diese Sprachmodelle basieren auf neuronalen Netzwerken und wurden mit riesigen Textmengen trainiert. Eine solche KI in eine Software wie polyEstate zu integrieren ist technisch trivial. Zutat 1: Check!
Zutat Nr. 2: Die richtigen Prompts
Die Herausforderung besteht in der zweiten Zutat: den so genannten Prompts. Ein Prompt ist die Anweisung vom User an die KI. Wie ein Prompt formuliert ist, entscheidet darüber, wie sinnvoll die Aufgabe von der KI umgesetzt wird. So spuckt ChatGPT bei einem unzureichenden Prompt zur Objektbeschreibung gerne das Attribut "bodentiefe Fenster" aus, auch wenn diese in Wirklichkeit gar nicht im Objekt vorhanden sind.
Für ein gutes Prompting braucht es neben Erfahrung auch ein grundlegendes Verständnis der Funktionsweise von künstlicher Intelligenz. Wir haben über mehrere Wochen hinweg mit Prompts und den darüberhinausgehenden Einstellungsmöglichkeiten experimentiert, um optimale Eingaben für unseren Zweck zu erzeugen. Zutat 2: Check!
Zutat Nr. 3: Die richtigen Informationen
Die dritte Zutat ist die Informationsgrundlage der Internetanzeigen. Zum einen sind das die "harten Fakten" zum Objekt wie Fläche, Zimmerzahl, Etage und so weiter – diese Attribute liegen in polyEstate immer vor. Zusätzliche Ausstattungsmerkmale der Wohnung erhalten wir entweder über die Schnittstelle aus dem ERP-System des Kunden oder sie werden manuell von den jeweiligen Vermietern in polyEstate gepflegt.
Zum anderen braucht die KI qualitative Angaben, die standardmäßig nicht im CRM-System gespeichert sind. Dafür haben wir für die User zwei simple Schritte ergänzt. Zunächst wählt man aus einer umfangreichen Auswahlliste das treffende Adjektiv für die Prompt "Beschreibe die Wohnung mit einem Wort". Im zweiten Schritt erscheint ein kundenspezifisches Set von zusätzlichen Besonderheiten, aus denen die User eine oder mehrere wählen sollen, beispielsweise "Spielplatz in direkter Nähe". Diese zusätzlichen Informationen integriert die KI gemäß unserer Prompts in den Anzeigentext.
Zutat Nr. 4 (optional): Beispieltexte
Für den Feinschliff ermöglicht polyEstate die Eingabe von bis zu drei besonders guten Anzeigentexten, die in der Vergangenheit vom Team geschrieben wurden. Die KI imitiert dann den Stil dieser Beschreibungen.
Warum ChatGPT – und warum bald (vielleicht) nicht mehr?
Neben ChatGPT gibt es eine Reihe weiterer KIs auf dem Markt – genauso, wie ChatGPT selbst mittlerweile in mehreren Versionen daherkommt. In einem langen Auswahlprozess haben wir uns verschiedenste generative KIs auf Basis von Large Language Models angesehen und gründlich getestet.
Letztlich fiel die Wahl auf ChatGPT 3.5, das wir momentan noch nutzen. Dafür ausschlaggebend war das aktuelle Preis-Leistungs-Verhältnis. Zwar gibt es mit ChatGPT 4 bereits eine neuere Version, die hat für das Generieren für Internetanzeigentexte jedoch keinen Mehrwert. Wir binden ChatGPT kostengünstig über die Azure Open AI-Services von Microsoft ein.
Aber: Aufgrund der Intransparenz von OpenAI streben wir in Zukunft einen Wechsel an. Wir möchten gerne eine Open-Source-Modell nutzen, das offen zugänglich und dessen Training nachvollziehbar ist. Falcon 2.0 und Llama 3 sind Beispiele für Open-Source-KIs. Mit beiden Modellen haben wir bereits eine selbst gehostete Testinfrastruktur aufgesetzt und gute Resultate erzielt. Leider übersteigen die Kosten derzeit noch deutlich die der Nutzung der Azure Services. Aktuell sind wir in Gesprächen, um mit Partnern eine gemeinsame "Hosted in Germany"-Infrastruktur aufzubauen, also eine Open-Source-AI auf eigenen Servern zu betreiben.
Welche Datenschutzbedenken gibt es?
Gute Nachricht: Keine! Zumindest für den oben beschriebenen Anwendungszweck der Titel- und Anzeigentextgenerierung. Denn: Die Eingaben basieren ausschließlich auf den "harten Fakten" – den Stammdaten aus dem System und den Auswahllisten mit den qualitativen Merkmalen. Letztere sind zwar kundenspezifisch konfiguriert, sie werden den Usern jedoch vom System fest vorgegeben. Freitexteingaben sind nicht möglich! Somit ist ausgeschlossen, dass personenbezogene Daten in die Prompts einfließen.
Unterm Strich
Durch den Einsatz generativer KIs können wir die Erstellung von Internetanzeigen unterstützen, um aussagekräftige Beschreibungstexte mit einem Mausklick zu erzeugen. Das freut zum einen die Interessenten, die sich so ein besseres Bild von den angebotenen Objekten machen können. Und es entlastet vor allem die Vermietung, die ihre Arbeitszeit nun für eine bessere Betreuung der Kunden nutzen kann. Die Herausforderung besteht nicht in der Implementierung der KI in eine bestehende Software wie polyEstate, sondern in der Formulierung der richtigen Prompts – also darin, die KI mit Know-How für die eigenen Zwecke zu nutzen.