GPT-5 ist da: drei Modellvarianten, mehr Kontext, schnellere Antworten – und trotzdem Kritik. Wir testen Thinking-, Pro- und Standardmodell, prüfen Programmier- und Gesundheitsversprechen und zeigen Tricks gegen Halluzinationen. Plus: Updates zu Palantir, Patientenakten und Instagram.

Transkript der Episode

Jingles:
Silicon Weekly, der Tech-Podcast mit den wichtigsten News der Woche. Für dich eingeordnet von Elli, Stella und Caspar.

Elli:
Hallo und herzlich willkommen zu einer neuen Folge Silicon Weekly. Schön, dass ihr wieder eingeschaltet habt. Ich hätte schon fast gesagt, na, habt ihr uns vermisst? Es geht wieder los. Wir schwitzen und haben das Internet nach den wichtigsten Dingen durchsucht, damit ihr nicht so viel Zeit vorm PC verbringen müsst, sondern irgendwo in der Sonne sitzen könnt und ein Eis isst oder euch nochmal ein Glas Wasser reinstellt. Und wer sind wir? Ich würde sagen, wir machen das mal wie im Intro, die Reihenfolge. Also ich bin Elli, hallo.

Stella:
Ich bin Stella, moin.

Elli:
Und dann habe ich noch mit Sitzen den Mitmoderat.

Caspar:
Caspar, hallo. Hitze ist auch ein gutes Stichwort. Falls Elli zwischenzeitlich mal anders klingt oder so ein Rauschen im Hintergrund ist. Mir geht es ein bisschen wie ihrem Laptop, die Hitze macht mir zu schaffen. Und ich habe daran zu knapsen. Aber im Gegensatz zu dem Laptop habe ich keinen Lüfter, der immer lauter wird und hochdreht. Und insofern muss man überlegen, ob das gut ist.

Elli:
Du leidest leise, ne?

Caspar:
Ich leide leise im Vergleich zum Laptop. Also die Audioqualität, es liegt einfach an deinem Laptop. Aber das ist okay. Wir haben ja in der Regel nicht 33 Grad, wenn wir aufnehmen. Heute ist es halt leider so.

Elli:
Genau, mein Problem ist auch ein bisschen, mir ist aufgefallen, dass mein Laptop das vielleicht nicht so gut verkraftet heute, das ist mir gestern eingefallen. Da war es schon heiß und da wollte ich ihm nicht noch ein Backup zumuten. Sonst hätte ich ein Backup gemacht und ihn aufgeschraubt und den Lüfter einmal gesäubert. Das kann man ja machen, gerade wenn keine Garantie mehr auf dem Gerät drauf ist. Aber auch fürs Backup war es gestern zu warm. Deswegen sitze ich in der Patsche, bis es wieder ein bisschen kühler wird. Dann fixe ich das und beim nächsten heißen Aufnahmetag hebt er vielleicht nicht mehr ganz so ab.

Caspar:
Tausend Jahre Garantie. Du kriegst einfach mal so einen Laptop ohne Lüfter. Also meiner hat keinen Lüfter mehr, das ist bei den Temperaturen jetzt auch ein Problem. Ich glaube, jetzt aktuell würde er ganz gerne lüften, kann er aber auch nicht. Hier ist es auch zu warm, er ist langsamer als sonst.

Elli:
Kann man da nicht irgendwann ein Spiegelei drauf braten? Das ist ja absurd, die Vorstellung für mich.

Caspar:
Ich fasse ihn einfach nicht an.

Elli:
Ich möchte keinen Laptop ohne Lüfter.

Stella:
Ich mache das wie Caspar, also Elli, auf meinem kannst du, glaube ich, also ich glaube, auf meinem kannst du ein Spiegelei braten. Ich habe es noch nicht ausprobiert. Dazu ist es mir zu schade. Aber wollen wir mal mit einem Update anfangen, bevor wir jetzt hier Kochtipps mit dem Laptop gleich vergeben.

Caspar:
Es wird schon wieder ein Koch-Podcast. Ja, lass uns inhaltlich werden.

Elli:
Ich gebe euch nächste Woche noch ein Update dazu, wie es mit der Reinigung lief meiner Lüftung und ob es dann besser ist. Aber jetzt fangen wir mit was zum Thema Polizei an.

Jingles:
Update.

Stella:
Es ist nicht nur was zum Thema Polizei, sondern etwas darüber, wie ich glaube in gefühlt jeder der vergangenen Folge einmal im Input und danach immer im Update gesprochen haben. Wir setzen das auch diese Woche fort. Es geht um Palantir. Das ist ja eine Datenanalyse-Software von Palantir, die zum Beispiel von der bayerischen Polizei unter dem Begriff Vera eingesetzt wird. Es ist eine umstrittene Anwendung. Was macht sie, grob gesagt? Sagt, sie kombiniert sehr, sehr viele verschiedene Datensätze und soll eben der Polizei bei Ermittlungen helfen. Im Norden wird das Ganze jetzt aber abgelehnt. Niedersachsens Innenministerin Daniela Behrens hat sich nämlich, wie der NDR berichtet, dagegen ausgesprochen, die Software von Palantir zu nutzen.

Elli:
Finde ich einen sehr spannenden Schritt. Wir kommen auch gleich noch dazu, was sie dazu gesagt hat. Weil ja gerade auch bekannt geworden ist, darüber haben wir letzte Woche gesprochen, dass Bundesinnenminister Alexander Dobritsch den Einsatz auf Bundesebene prüfen lässt derzeit. Aber Frau Behrens hat sich eben gegenüber dem NDR geäußert und auch gegenüber der Hannoverischen Allgemeinen Zeitung. Stella, was hat sie denn da gesagt?

Stella:
Jetzt kommt ein Zitat und zwar, für mich ist entscheidend, dass teils hochsensible Polizeidaten in den Händen eines solchen Unternehmens landen können. Zitat Ende. Also solchen Unternehmens bezieht sich auf Palantir, das eben aus den USA kommt und unter anderem dem umstrittenen Investor Peter Thiel gehört. Und nicht nur Niedersachsen spricht sich dagegen aus, sondern auch Bremen sowie Hamburg.

Caspar:
Der Norden ist stabil.

Elli:
In Hamburg gab es da ja in der Vergangenheit schon Diskussionen. Mal gucken, wo es dann insgesamt hingeht. Wir haben noch so einen Dauerkandidaten für die Updates.

Stella:
Und da geht es um die EPA, die elektronische Patientenakte. Ich finde diese Abkürzung also irgendwie, ich weiß nicht, was mich daran triggert, aber irgendwie finde ich sie kurios. EPA. Und zwar ist es bisher aus Sicherheitsgründen eigentlich verboten, die Identifikation für diese elektronische Patientenakte per Video durchzuführen.

Stella:
Das ist so, das hat was mit Sicherheitsbedenken zu tun, da komme ich gleich nochmal zu. Aber gleichzeitig ist die EPA, ich weiß nicht, wie es bei euch beiden ist, ich persönlich habe sie bisher auch nicht genutzt, auch nicht unbedingt weit verbreitet. Also sie hat eher weniger NutzerInnen gefunden. Und es mag auch teils an der recht komplizierten Aktivierung liegen, Denn die funktioniert bisher nur mit der elektronischen Gesundheitskarte oder mit der Online-Ausweisfunktion. Das Ganze braucht auch immer einen PIN, ist also eine langwierige Angelegenheit, bis man das dann mal durch hat. Und durch das neue Verfahren soll sich das eben ändern. Und dieses neue Verfahren, das kommt vom Hamburger Unternehmen NECT und heißt offiziell passenderweise NECT-Ident mit e-Pass. Und was passiert dabei? Es geht zum Beispiel immer noch mit einer Gesundheitskarte, die wird benötigt, damit das Ganze freigegeben werden kann, damit so ein Login für diese Patientenakte erstellt werden kann. Und das funktioniert eben über dieses Unternehmensangebot mit diesem Video-Ident-Verfahren. Und wie das Portal Netzpolitik.org schreibt, ist das ganz überraschend, diese Entscheidung der Gematik, denn die hatte eben dieses Video-Ident-Verfahren wegen Sicherheitsrisiken vor drei Jahren noch als unzulässig eingestuft. Damals hat es auch Schwachstellen gegeben und dieses Verbot, das ist erfolgt als Reaktion auf einen Test vom Chaos Computer Club. Die haben nämlich gezeigt, wie leicht sich diese Identifikation per Video überlisten lässt.

Stella:
Und übrigens auch noch von der Recherche von Netzpolitik.org aus dem Artikel. Erst im Juli 2025 hat das Bundesamt für Sicherheit in der Informationstechnik, kurz das BSI, ein Dokument veröffentlicht. Da ging es um genau den digitalen Identitätsnachweis in der EU und damit verbundene Herausforderungen. Und was haben sie da gemacht? Sie haben auf die Gefahren auch mit diesem Video-Ident-Verfahren hingewiesen. Also schon ganz interessant, dass es jetzt eben diesen Wandel in der Entscheidung gibt, was die Nutzung vielleicht einfach vereinfachen soll.

Elli:
Weil so viel ungefährlicher oder unkritischer ist das Ganze nicht geworden. Aber da wird jetzt halt versucht, irgendwie Leute ranzuholen. Ich kann es auch verstehen. Ich bin auch tatsächlich, auch wenn ich weiß, dass das nicht das sicherste Verfahren ist. Aber ich finde so Video-Ident ist dann doch manchmal einfach praktischer. Es geht schneller, es ist einfacher. Zwickmühle, klassische Zwickmühle, würde ich sagen.

Stella:
Es gibt für beide Seiten ein Pro und Contra. Wie sieht es aus? Seid ihr bereit für ein WTF? Heute haben wir nämlich wieder eins dabei.

Elli:
Ja, ich lasse euch nur eine Sekunde alleine und hol ein Kühlpack für meinen Laptop. Bis gleich.

Caspar:
Ein guter Plan.

Jingles:
WTF?

Caspar:
Ja, also der Laptop von Ellie könnte schon fast ein gutes WTF sein.

Stella:
Damit haben wir aber nicht gerechnet.

Caspar:
Nein, nein, nein.

Stella:
Dazu gab es keine Nachrichten.

Caspar:
Genau, wir haben aber ein WTF und Stella, da musst du mir jetzt helfen, in unserem Doc steht und ich habe das, als ich das das erste Mal gelesen habe, es mag an der Hitze liegen, habe ich direkt an was Falsches gedacht. Da steht nämlich, Instagram führt Kartenfunktion an und ich dachte, hä, wieso soll ich jetzt mit meiner IT-Karte bei Instagram zahlen? Darum geht es aber gar nicht. Es geht um eine andere Karte, auf die man auch theoretisch hätte kommen können.

Stella:
Ja, es geht auch nicht. Ich glaube mal vor Jahren gab es als Meta noch Facebook-Keeps auch diese eigene Digitalwährung, die da angestrebt wurde. Also in die Richtung wollen wir überhaupt nicht. Nein, es geht darum, dass Instagram oder Meta eigentlich mal wieder abgeschrieben hat. Wir kennen das ja schon, beispielsweise mit der Story-Funktion. Die hatte es sich damals von Snapchat geholt. Und Snapchat, da haben sie sich wieder dran bedient. Das ist nämlich ein Dienst, über den können NutzerInnen selbstlöschende Bilder versenden. Und dazu gibt es in dieser App die SnapMap. Und auf der sehen sich UserInnen gegenseitig, sofern sie eben den Standort freigegeben haben. Und genau diese Funktion, die kommt jetzt zu Instagram. Also Achtung, erstmal nur in den USA als Testphase, soll aber auch international folgen. Wann es das Ganze in Europa, in Deutschland gibt, wissen wir zum jetzigen Zeitpunkt nicht. Das Prinzip, ich erkläre es einmal kurz, sobald, also jetzt bei Instagram, sobald die App geöffnet ist, da wird eben der Standort auf dieser Karte aktualisiert, sofern das Ganze freigeschaltet ist. Standardmäßig ist diese Freigabe übrigens erstmal deaktiviert des Standorts, aber es hat dann Auswirkungen auf die Nutzung. Wenn ich beispielsweise meinen Standort dort freigegeben habe und jetzt eine Story poste, dann wird die eben mit diesem Standort verknüpft und wer auf den Standort klickt, der kriegt dann auch meine Story angezeigt. Ist auch ähnlich übrigens wie bei Snapchat.

Stella:
Und erreichbar ist diese Karte dann über den Direktnachrichtenreiter, aber wie gesagt, in Europa gibt es das Ganze noch nicht. Das würde eigentlich schon ein bisschen alleine wegen des Abkupferns, finde ich, zum WTF reichen, weil ich mich auf Frage... Entschuldigung, wer braucht das denn jetzt? Es gab da auch natürlich direkte Diskussionen darum, was ist mit CreatorInnen oder generell auch mit Prominenten, die Instagram nutzen und dann plötzlich nichts ahnt, in den USA ihren Standort, Gott sei Dank ist es ja generell deaktiviert, aber das war auch eine Frage, was passiert denn eigentlich, wenn da plötzlich jemand, der nicht möchte, dass sein Standort öffentlich ist, aus Versehen das Ganze veröffentlicht.

Caspar:
Ich weiß auch nicht, ob das nicht auch eine Generationsfrage ist. Das habe ich mir schon manchmal gestellt, weil ich habe das mitbekommen, jetzt mag es sein, dass ich auch völlig daneben liege, da mögt ihr mir helfen oder auch vielleicht unsere Hörerinnen und Hörer, vielleicht latsche ich da auch in eine Klischeefalle. Aber ich habe das durchaus mitbekommen, dass es junge Menschen gibt, die sehr gerne im Freundeskreis ihren Standort teilen, um einfach voneinander zu wissen. Und da gibt es ja auch immer wieder Apps, die das bedienen. Ich weiß, dass es Apps gab, die zum Beispiel gesagt haben, guck mal, du kannst den Standort teilen und du siehst dann, wenn jemand in deiner Nähe ist und kriegst dann eine Benachrichtigung nach dem Motto, ach guck mal, ihr seid euch fast über den Weg gelaufen, wollt ihr euch nicht mal dann wirklich über den Weg laufen, nur nach dem Motto. Und ich habe immer so ein bisschen, als ich die Nachricht gelesen habe, dass diese Funktion kommt, dachte ich, nein danke, Insta, das möchte ich wirklich nicht. Aber ich weiß halt nicht, ob das ich bin, der das so ein bisschen kritisch schien. Das Netz sieht es auch kritisch. Als die Ankündigung kam von Instagram, standen ganz viele Kommentare darunter nach dem Motto, niemand hat gefragt, dass diese Funktion kommt. Ihr gebt sie uns. Ich weiß nicht, ob wir das brauchen. Ja, ich weiß nicht, wie ihr seht, aber ich bin so ein bisschen eher kritischer als vielleicht andere.

Stella:
Also ich habe zum Beispiel mit Freundinnen auch meinen Standort jetzt direkt über die Woist-App geteilt bei Apple, was ich sehr praktisch finde, gerade wenn man abends zusammen unterwegs ist. Das hat auch was mit Sicherheitsgefühl zu tun. Ich teile dann auch häufig meinen Standort zum Beispiel via WhatsApp. Das sind so Sachen, die mache ich schon regelmäßig. Ich brauche es aber jetzt nicht via Instagram. Also ich möchte gar nicht unbedingt meine privaten Storys damit verknüpfen und finde das auch ganz, also es ist für mich auch ein Unterschied, ob ich mit einer kleinen Gruppe, die ich wirklich gezielt auswähle, meinen Standort bewusst teile oder ob ich das holterdiepolter plötzlich mit sämtlichen FollowerInnen, denen ich auch Folge mache. Das, ja, also habe ich jetzt auch nicht nachgefragt und habe ich auch bei Snapchat aus. Also da sieht man auch nicht, wo ich mich befinde. In Teilen brauche ich es persönlich, aber ich brauche es nicht immer. Elli, wie siehst du es?

Elli:
Ich muss sagen, ich bin kein Fan von zu viel Standortfreigabe. Ich versuche das auch immer, wenn ich Google Maps benutzt habe, danach wieder dran zu denken, dass ich den Standort wieder ausschalte. Das gelingt mir leider nicht immer, aber allein was da an Daten schon irgendwo hingeht, wo ich bin, wo ich wann bin, wo ich hingehe, keine Ahnung. Das, finde ich, ist alles Info, die nicht unbedingt andere Leute, was angeht. Manchmal gebe ich einen Standort raus, auch per WhatsApp, das tatsächlich auch, da bin ich bei dir, Stella. Ich sehe es aber wirklich auch nicht, den Nutzen bei einer Social Media App, sorry, Instagram, Meta, ihr kriegt doch schon über WhatsApp im Zweifel die Standorte der Leute. Was wollt ihr denn noch?

Caspar:
Was wollt ihr denn noch?

Stella:
Dass die anderen sie sehen. Also ich glaube, das ist, gerade passiert das in so einem Kontext von wegen, Instagram möchte mehr, dass wir mit FreundInnen, mit Bekannten und so interagieren über die App. Es wurden nämlich noch ein paar neue Funktionen vorgestellt, die es auch schon in Europa, in Deutschland gibt. Und eine davon ist mir persönlich, also da habe ich auch gedacht, das brauche ich jetzt überhaupt nicht. Vielleicht habt ihr schon mal gesehen, wenn ihr die App öffnet. Ihr habt wundervoll im Real Feed jetzt auch was Neues, nämlich extra einen eigenen Reiter für das, was eure FreundInnen geliked und kommentiert haben. Da ist es dann auch so, die Kommentare werden dann sehr publik angezeigt, quasi so ein bisschen über dem Namen des Postenden. Da habe ich auch gedacht, also das brauche ich nicht wirklich und habe es auch direkt ausgemacht, damit ich da nicht erscheine. Wie macht ihr das? Ihr geht in die Einstellung in der Instagram App, also dafür klickt ihr auf euer Profil, auf den kleinen Kreis mit eurem Foto und dann auf die drei Balken, das sogenannte Burger-Menü. Dann scrollt ihr runter bis zum Blog, wer deine Inhalte sehen kann und klickt dort auf Aktivitäten auf dem Tab Freunde und dann setzt ihr die Einstellung einfach auf niemand.

Caspar:
Ich habe Leute unter Umständen schon mal ein bisschen neu kennengelernt in den letzten Tagen in diesem Freundeskreifer, weil ich habe mir den Spaß mal gemacht, um da ein bisschen durchzugucken. Also es ist schon, ich glaube, dass viele Leute gar nicht wissen, dass diese Likes, die sie vergeben, dort jetzt zu sehen sind. Und damit finde ich das dann wiederum fast schon, ich weiß nicht, ein Sicherheitsrisiko ist es nicht. Aber ich finde es wieder mal bedenklich von Instagram. Weil klar, wenn du diesen Freunde-Reiter siehst, da zufällig drauf stößt und den dann anklickst und dann irgendwie die Schlussfolgerung ziehst, oh, jetzt sehen alle Leute, was irgendwie geliked wird. Aber so richtig hat mir das Instagram nicht mitgeteilt. Und ich bin mir bei manchen Leuten nicht sicher, ob das gut ist, dass jeder jetzt sieht, was die Leute liken. Also das meinte ich mit Leute anders kennengelernt. Ich habe das auch direkt ausgeschaltet. Ich glaube persönlich, dass über meine Likes jetzt nicht Dinge rauskommen, die ich nicht hätte kundtun wollen, aber ich finde es trotzdem, also es ist gleich noch ein zweites WTF von Instagram, finde ich.

Elli:
Ja, an der Stelle vielleicht auch tatsächlich mal so, mir ist das auch irgendwann aufgefallen, ich überlege wirklich, welche Dinge ich like und welche nicht, weil ich ja auch weiß, ich habe auf Instagram viele Leute, mit welchen Leuten ich vernetzt bin, aber definitiv nicht alles meine Freunde, sondern auch bekannte, ehemalige KollegInnen, ehemalige, da mal ein Praktikum gemacht und kennengelernt und pipapo, also so ganz entfernte Bekanntschaften, auch das sind Menschen, mit denen ich quasi auf Instagram vernetzt bin und das muss man jetzt auch nicht immer alles quasi, sichtbar machen, wenn so, gerade wenn jetzt so eine Einstellung kommt, wo nicht vorher gesagt wird, du übrigens, wenn du jetzt Dinge likest, Dann wird das noch mal prominenter angezeigt. Das wurde ja auch vorher schon angezeigt im Zweifel. Gefällt Person X oder Z aus seinem Freundeskreis und 300.000 anderen Personen.

Stella:
Ja, aber eben halt nicht so publik. Und es ist noch eine Funktion dazugekommen. Ist bei TikTok abgekupfert. Ihr könnt jetzt nämlich Sachen reposten. Und dann sollen die auch in so einem eigenen Reiter im Profil angezeigt werden. Also dauerhaft. Man kann ja schon was in die Story hochziehen. Das verschwindet dann aber halt nach 24 Stunden. Das, finde ich, ist auch noch mal echt eine Neuerung, dass man dann das Ganze die ganze Zeit sehen kann. Ich weiß nicht, ob das das Nutzungsverhalten irgendwie verändert. Für Instagram ist das alles unter dieser, ja, nicht Mission, aber unter diesem, die Leute sollen wieder näher zusammenrücken und sich mit Bekannten austauschen. Aber ich persönlich brauche jetzt keine der drei Funktionen.

Elli:
Ich wollte gerade sagen, wenn ich mich mit meinen Bekannten näher austauschen will, dann mache ich Instagram aus dafür.

Stella:
Aber das ist nicht im Sinne von Meta.

Caspar:
Ich wollte gerade sagen, das ist nicht im Sinne von Meta.

Elli:
Richtig, aber das mit dem Reposten finde ich insofern spannend aus der Sicht von Creatoren, also Menschen, die Inhalte erstellen und vielleicht sich freuen, wenn man das dann auch teilt im Profil, einfach damit sie zusätzliche Reichweite bekommen, damit bestimmte Messages, Botschaften, Aufklärungssachen oder sowas mehr Reichweite bekommen. Dafür kann man das mit dem Reposten schon ganz gut nutzen, finde ich.

Caspar:
Ja und es ist ja bekannt von textbasierten Social Media Plattformen, wie zum Beispiel früher mal Twitter, von Threads und solche Sachen, da gibt es ja sowas wie reposten schon sehr lange und es ist ja durchaus auch üblich, dass man dann Dinge mal repostet, die man seiner eigenen Followerschaft irgendwie mitteilen möchte oder meinetwegen sowas wie eine kuratierte Liste an Inhalten, die irgendwie gut sind. Und das ist ja durchaus auch mal ganz spannend, wenn das dann auch mal mit Storys und Postings passiert bei Instagram. Also das ist eine Funktion, da würde ich jetzt kein WTF dranhängen wollen. Das sehe ich irgendwie noch. Es gab auch immer mal wieder Situationen, wo ich gedacht habe, wieso kann ich das jetzt nicht reposten oder meine eigene Story packen? Das ist ganz gut. Aber die anderen zwei Sachen, naja, wir haben drüber gesprochen. Kann man mögen, muss man nicht.

Elli:
Ja, und selbst wenn ihr kein Instagram habt, dann wisst ihr jetzt auch, was da abgeht. Trotz allem, was noch abgegangen ist, und zwar wie Schmitz Katze, ist eine neue KI-Version und über die sprechen wir im Input. Ich dachte auch erst kurz, oh Gott, warum müssen wir darüber sprechen? Aber selbst, wenn ihr selber nicht so KI-Tools benutzt, bleibt dran, es wird spannend, kurios, interessant und dann seid ihr auf dem neuesten Stand.

Caspar:
Und wir fangen mit einem Blick zurück an. Lang, lang ist es her, wollte ich gerade sagen, aber es ist etwas über drei Jahre, ja. Da haben wir drei Hübschen über die erste frei verfügbare oder öffentlich verfügbare Variante des GPT-Modells von OpenAI berichtet. Damals noch in einer anderen Funktion, zumindest die meisten von uns drei.

Stella:
In einem anderen Stream, muss man auch sagen.

Caspar:
In einem anderen Stream.

Stella:
Genau. Falls ihr jetzt ganz nach unten scrollt, das werdet ihr nicht finden.

Caspar:
Nein.

Stella:
Dazu müsst ihr mal T3N Ketchup eingeben. Dann könntet ihr fündig werden.

Caspar:
Ja, und dann würdet ihr sehen, dass wir in dieser Folge damals, wir haben JetBot ChatGPT, den haben wir gehabt, das fand ich schon mal lustig, den ChatBot ChatGPT. Und wir haben ihn als Netzfundstück deklariert. Mein Gott, waren das Zeiten. Vor dreieinhalb Jahren. Und wir waren, ich habe mir die Stelle nochmal angehört, wir waren mit dem Konzept der Halluzination so ein bisschen überfordert. Es ist ganz niedlich, sich uns anzuhören, wie wir zum ersten Mal so ein Chatbot ausprobieren. Wir haben dem nämlich drei Fragen gestellt. Und Überraschung, bei der dritten Frage hat das Ding einfach wild halluziniert. Das war für uns ganz neu.

Elli:
Ja, ich würde sagen, an der Stelle ist ein, sie werden so schnell groß angebracht, denn aus unserem kleinen Netzfundstück, Golden Nugget in Anführungszeichen ist sehr viel geworden. Ihr habt es mitbekommen, es ist wahnsinnig schnell gegangen. Ich finde auch drei Jahre ist nichts gefühlt. Und jetzt haben wir da einen Giganten, einen Marktführer und so weiter vor uns. Und wir haben die mittlerweile fünfte Generation seit der vergangenen Woche. Es ist kein... Kein Nischenthema mehr, über das wir sprechen kein Fundstück mehr, sondern es ist absoluter Mainstream. Aber es gibt zu dieser Version fünf verschiedene Meinungen.

Stella:
Es gibt schon die ersten als Teilgiger, die wünschen sich das alte Modell, zum Beispiel GPT-4O, zurück. Also die Meinungen im Netz sind gespalten, aber wir haben es erstens natürlich selbst ausprobiert und zweitens fangen wir jetzt erstmal an. Was ist neu? Also erstmal ganz faktisch auf die Basis gucken, bevor wir uns die ganze Aufregung da drumherum mal vornehmen.

Elli:
Und ich muss sagen, bei den Leuten, die sich die ältere Version zurückgewünscht haben, ist der Grund teilweise durchaus skurril und befremdlich, aber dazu kommen wir. nach den technischen Details.

Caspar:
Skurril können wir. Lasst uns mal anfangen, darüber zu sprechen, was sich denn überhaupt Neues getan hat. Wir sprechen über GPT-5. Und das sind im Grunde drei neue Modelle, die vergangene Woche vorgestellt wurden. Einmal das ganz klassische GPT-5, quasi das Standardmodell. Dann haben wir GPT-5 Thinking und GPT-5 Pro. Wieso das eigentlich nicht, also irgendwie dann doch nicht drei Modelle sind, da kommen wir gleich noch zu. Aber merkt euch erstmal diese Dreiteilung. Standardmäßig ist es so, dass hier, wenn ihr die Web-Oberfläche von JetGPT ansteuert, dass halt eben GPT 5 ausgewählt ist. Und das ist auch, und das ist eine der Neuerungen, egal ob ihr einen kostenlosen Account habt oder nicht, oder ob ihr einer diesen Abo-Plänen nutzt. Das heißt schon mal eine gute Nachricht, alle Nutzerinnen und Nutzer können das aktuellste, neuste Modell nutzen. Das war früher nicht so und auch gerne mal in der EU so, dass wir die Sachen nicht unbedingt sofort bekommen haben. Heißt aber auch, und da kommen wir zu dem Punkt, den wir eben ganz kurz schon angerissen haben, dass sich manche Leute die alten Modelle zurückwünschen. Wieso tun sie das? Nun, weil sie die alten Modelle schlicht und ergreifend nicht mehr auswählen können. Nur noch das neue Modell GPT-5 in diesen drei Varianten ist quasi verfügbar.

Stella:
Wobei, Caspar, wir zeichnen jetzt am 13. August auf. Stimmt, ja. Und das hat sich mittlerweile geändert. Wir kommen später noch zu dem, ja, der negativen Netzreaktion. OpenAI hat reagiert. Man kann jetzt auch wieder GPT-4 auswählen, aber nur als zahlender Pro-Nutzer. Und ich finde, das ist noch mal wichtig. Mit einem kostenlosen Plan, in Anführungszeichen, hast du gar keine Wahl mehr. Die wird einfach GPT-5 quasi vorgeschlagen. Du musst es nehmen. Und das Besondere daran ist, du kannst nicht richtig auswählen, wir erklären gleich, was die Modelle sind, welches Modell genau getriggert wird. Und das kannst du beim Pro-Modell schon machen. Also ich finde, das ist ein großer Unterschied tatsächlich. Klingt erstmal positiv, aber ob es wirklich positiv ist... Weiß ich nicht.

Elli:
Ich habe jetzt an der Stelle mal eine Frage. Und zwar ist mir das schon aufgefallen bei der Benennung der unterschiedlichen Varianten, die ich ja jetzt nicht selber auswählen kann, wenn ich das gratis benutze. Aber heißt es dann, das eine denkt und das andere nicht? Weil das eine heißt ja Thinking und das andere nicht.

Caspar:
Völlig richtig. In der Theorie hast du recht. Das GPT-5-Modell denkt zumindest erstmal nicht lange nach. Dessen Aufgabe ist, schnell zu antworten. Und je nachdem, was du ihm für eine Aufnahmeaufgabe gibst, tut es das auch und es ist tatsächlich auch schneller. Da kommen wir gleich nochmal ein bisschen zu. GPT-5 Thinking, das ist ein sogenanntes Reasoning-Modell. Das heißt, das spuckt ja nicht direkt eine Antwort aus, sondern es geht quasi erstmal in sich und versucht einen Lösungsweg, sich zu überlegen und denkt darüber längere Zeit nach. Ich habe in unserem Test auch tatsächlich geschafft, dieses Modell teilweise über zwei Minuten zum Nachdenken zu bringen. Dann sitzt man da, guckt auf die Uhr Und irgendwann kommt dann tatsächlich die Antwort. Und GPT-5 Pro, das ist dann quasi das ganz große Modell, dessen Ansatz ist, dass es gleich mehrere dieser Thinking-Modelle vereint, deren Antworten alle einsammelt und dann nochmal darüber nachdenkt, welche Antwort in welcher Form die beste ist und diese dann ausspuckt. Das dauert dann nochmal ein bisschen länger, aber die Grundidee ist quasi in der Theorie, wir kommen gleich noch zur Praxis, ihr habt eine Dreiteilung, wollt ihr eine schnelle Antwort, wollt ihr eine bessere Antwort oder wollt ihr die beste Antwort quasi haben?

Elli:
Wie schon erwähnt, so richtig aussehen kann, zumindest ich, wenn ich die Gratis-Version benutze, das nicht, sondern ChatGPT versucht dann situationsgemäß quasi selbst zu entscheiden, was wird jetzt gebraucht. Ich finde es aber ganz lustig, es gibt ja meistens so Workarounds für, die Techniken der Tools und auch hier, man kann natürlich jetzt sowas schreiben wie denk mal richtig hart drüber nach, denk mal richtig, ausführlich, sinniere mal, Überleg, denk dir, du wärst ein Philosoph und könntest dir alle Zeit der Welt nehmen, so nach dem Motto. Dann könnte man natürlich vielleicht so dieses Thinking-Modell doch anschmeißen, ohne das auswählen zu können.

Caspar:
Wir kommen jetzt zum sogenannten Kontext, den die Modelle sich jetzt, also mehr Kontext merken können. Das ist auch nochmal ein Unterschied von GPT-5 zu den Vorgängermodellen. Es ist mehr Kontext möglich. Was heißt das? Wenn wir drei uns hier unterhalten, dann merken wir uns das und wir merken uns auch, was in den vergangenen Wochen war, weil wir relativ ein langes Gedächtnis haben. Und je nachdem, was es ist, können wir uns Sachen auch noch viel, viel länger merken. Diese GPT-Modelle, die haben nur eine gewisse Zeichenzahl an Dingen, die sie sich merken können. Und die bisherigen Modelle haben irgendwann dann relativ schnell, das kann man auch merken, wenn man sich länger mit so GPT-4O oder so unterhalten hat, merkt man, dass das Dinge aus der Anfangszeit der Konversation, also zu Beginn des Gesprächs, gerne mal auch mal wieder vergisst oder durcheinander bringt. Das merkt man vor allem, wenn man Geschichten versucht, mit dem Ding zusammenzuentwickeln. Ich weiß nicht, ob ihr das mal versucht habt, Storytelling, mal was zusammenzubauen. Die vergessen dann einzelne Personen aus dieser Geschichte oder Handlungsstränge oder irgendwas, was bereits passiert ist. Da stößt man relativ schnell an Grenzen. GPT-5, die Modelle haben mehr Kontext, können sich also mehr merken. Worüber sprechen wir? Naja, wir reden hier ungefähr von einer Größenordnung von ein oder zwei Romanen, die in dieses Ding reinpassen. Das ist schon eine ganze Menge. Das sollte für viele der Gespräche oder was auch immer erstmal ausreichen, um Kontext zu haben.

Elli:
Okay, also wir haben jetzt verschiedene Versionen des Ganzen. Wir haben mehr Kontext als bisher. Wie sieht es denn aus? Was macht das jetzt im Alltag aus?

Caspar:
Ja, also was wir auf alle Fälle gemerkt haben, GPT-5 ist in vielen Bereichen schneller. Ich habe zwar gerade über dieses zwei Minuten Nachdenken gesprochen, aber in den Bereichen, wo es nicht nachdenkt, wo es nicht erstmal in sich geht, da sind zum Beispiel bei Textaufgaben ist es so, dass das Modell deutlich schneller ist. Also solche Anweisungen wie, fasse mir etwas zusammen, schreibe mir eine Geschichte, verfasse mir eine Mail. Also alles, wo es wirklich um so reine Textaufgaben geht, da merkt man, dass teilweise in Sekunden die Antwort kommt und es ist fast gruselig, wie schnell das teilweise geht. auch immer sehr schön, wenn man etwas hochlädt. Ich habe aus Spaß mal von Sam Altman, dem CEO von OpenAI, der hat ein Podcast-Interview gegeben, auf YouTube war das hochgeladen, ich habe das transkribiert und innerhalb von nicht mal ein, zwei, drei, Wimpernschlägen hat mir das aus diesem Transkript ein lesbares Interview gebastelt und das in wirklich einer Geschwindigkeit, die, nicht mal mehr im Ansatz einem Menschen hinterherkommen würde. Das war zwar vorher auch schon so, aber es ist jetzt nochmal deutlich flotter geworden und gefühlt, das lässt sich jetzt nicht so richtig nachweisen, Aber auch die Benchmarks sagen, dass es ist sprachlich ein bisschen ausgefeilter und nicht mehr so ganz KI-generisch, wie so Texte mit älteren Modellen bisher auch mal waren.

Elli:
Beim Stichwort Textaufgaben muss ich immer noch an Matheaufgaben mit Schrifttext denken. Kennt ihr die noch so mit Peter kauft fünf Melonen und er gibt drei davon seiner Mutter und so. Ja, aber das nur nebenbei.

Caspar:
Wie alt ist er dann?

Elli:
So ungefähr. Das wäre so eine typische absurde Frage. Und apropos Absurditäten, OpenAI macht ein großes Versprechen, das mich schon wieder skeptisch gemacht hat beim Lesen. Es geht um die Halluzinationen, die wir auch gerade schon am Anfang hatten. Wie sieht es da aus? Die sollen jetzt wohl weniger sein.

Caspar:
Ja, Spoiler, jein. Ich würde sie noch einen kleinen Moment nach hinten schieben. Wir kommen nämlich nochmal zu der Halluzination. Es ist aber wichtig, dass wir schon mal kurz drüber gesprochen haben. Es gibt Situationen, in denen deutlich weniger halluziniert wird. Es gibt aber auch welche, in denen das nicht der Fall ist, wie OpenAI das verspricht.

Caspar:
Da kommen wir gleich noch zu. Was ich vorher nochmal kurz erwähnen möchte, ist der Bereich des Programmierens. Das können so große Sprachmodelle ja auch einigermaßen gut und damit hat OpenAI auch groß geworben, dass ChatGPT5 jetzt besser im Programmieren sei. Und ich muss sagen, das ist zumindest in meinem Test auch durchaus so gewesen, dass Aufgaben damit gelöst werden konnten, die mit GPT-4 noch nicht funktioniert haben. Ich habe auch direkt für den Podcast was gebaut. Wenn ihr bei uns auf die Landingpage guckt, gibt es dort jetzt neuerdings so einen kleinen Bereich, wo immer die aktuellste Folge zu sehen ist und Buttons zum Abonnieren unseres Podcasts direkt in den verschiedenen Playern. Das ging mit GPT-4 nicht, das hat immer wieder Fehlermeldungen produziert und GPT-5 hat mir das innerhalb von 20 Minuten ein bisschen hin- und herschreiben und nochmal anpassen tatsächlich programmiert und das ist schon mal deutlich besser. Aber Achtung, auch hier, wir reden hier nicht davon, dass das eine Programmiererin oder ein Programmierer ersetzt. Ihr könnt damit kleine Programmieraufgaben erledigen oder etwas, was ihr bisher selber noch nicht so richtig hinbekommen habt, versuchen nochmal besser zu machen. Spätestens, wenn es da mal um das Thema Sicherheit geht oder wenn ihr Code bauen wollt, der wirklich prominent irgendwo eingesetzt werden sollte, zum Beispiel in einer App, die ihr irgendwie verkaufen wollt oder so. Schwierig, schwierig, da sind wir noch nicht. Der Trend sagt aber, wenn das so weitergeht mit den Sprachmodellen, wer ist Programmieren durchaus mal so ein Bereich, wo die wirklich, wirklich gut werden könnten.

Elli:
Okay, jetzt hast du, Caspar, uns mal ein Programmierbeispiel mitgebracht. Ich mache heute einfach, ich stelle euch einfach Fragen, weil ihr einfach die spannenden Beispiele mitgebracht habt. Und wir haben noch was mitgebracht, was Stella mal durchexerziert hat. Und das hat mit einem Versprechen zu tun, was im Zuge von ChatGPT 5 auch von OpenAI gemacht wurde. Und zwar in der Pressemitteilung. Da steht, dass besonders gesundheitsbezogene Fragen jetzt mit ChatGPT 5 besser geklärt werden könnten, angeblich. Und wie das so mit der Gesundheit sein soll, das hat Stella mal ausprobiert.

Stella:
Genau, ich habe das mal getestet und habe ehrlich gesagt, ich hatte einen Prompt, den hatte ich damals auch noch im alten Modell eingegeben und den habe ich einfach mal ins neue reingehauen, also eins zu eins gleich. Man muss dazu sagen, OpenAI hat auch gesagt, dass es nach wie vor kein Arzt, keine Ärztin ersetzt. Also das nochmal als Hinweis. Nächster Hinweis, ich spreche jetzt gleich über das Thema Gewicht. Ich habe mir nämlich einen Ernährungsplan einstellen lassen. Wer darüber, also wer sich dadurch getriggert fühlt, das nicht möchte, dem würde ich vorschlagen, jetzt mal drei Minuten so circa nach vorne zu springen. Ich weiß nicht, ob wir es vielleicht auch mit einer Kapitelmarke lösen können, aber, Lege ich jetzt los, jetzt wäre der Zeitpunkt zu springen, wenn ihr das nicht hören wollt. Und zwar, der Prompt war ganz einfach ein Ernährungsplan mit dem Thema Abnehmen. Ich habe für mich damals schon bei diesem Vormodell eine total unrealistische Angabe gemacht. Der Prompt, muss man auch sagen, der war nicht perfekt. Ich habe nämlich gar nicht angegeben, wie viel ich eigentlich wiege und wie groß ich bin. Das muss man jetzt auch mal sagen. Ist aber dem Modell auch nicht weiter aufgefallen. Das zeigt mal wieder, was ihr nicht eingebt. Das wird auch nicht nachgefragt. Wenn ich jetzt, glaube ich, euch beide fragen würde, würdet ihr mich zuerst fragen, hey, wie groß bist du und was wiegst du jetzt? Aber so funktioniert künstliche Intelligenz nicht. Dementsprechend, diese Angaben haben in beiden Pumps gefehlt.

Elli:
Kleiner Einschub an der Stelle. Ich würde zusätzlich auch noch fragen, wie körperlich aktiv du bist. Weil das hat ja einen ganz großen Einfluss darauf, wie viel du denn so verbrauchst.

Stella:
Guter Hinweis, das habe ich aber tatsächlich geschrieben. Ich habe nämlich mein Sportprogramm so grob geschrieben, allerdings bei den Zahlen habe ich geflunkert. Da habe ich mir irgendwas ausgedacht, einfach. Ja, also geht doch nicht hier. JetGPT muss doch nicht wissen, was ich wiege und wie groß ich bin. Also, jetzt erst mal generell schlechte Eingabe, schlechteres Ergebnis. So, das fällt auf meine Kappe. Jetzt erst mal die Ausgabe, die war bei beiden Modellen, sowohl dem alten als auch dem neuen Fünfer, die war erst mal übersichtlich. Aber was ich ganz interessant fand, GPT-5 hat sich viel, viel kürzer gehalten, war viel, also viel konkreter auch und nicht so freundlich. Also das alte Modell, das hat mich zugespampt mit Smileys und Feel-Tags. Das fehlte jetzt beim neuen komplett. Ich habe es übrigens beide mal in der kostenlosen Variante eingegeben. Das heißt, ich habe das Modell auch nicht auswählen können.

Stella:
Was ganz witzig fand, der Vorschlag fürs Frühstück ist exakt gleich geblieben. Also wirklich genau. Ich glaube, sechs Tomaten wurde mir da gesagt. Ich habe gesagt, ich frühstücke gern Toast mit Tomate und Mozzarella. Wie denn auch, das stimmt übrigens tatsächlich. Ich habe jetzt dann nochmal in dem neuen Modell das Ganze so gemacht, dass ich künstlich gesagt habe, okay, ich wiege das und das und bin so und so groß und mir eine Zahl ausgesucht zur Gewichtsreduktion innerhalb von zwei Wochen, die mich eindeutig zu Untergewicht gebracht hätte. Jetzt muss ich sagen, das neue Modell hat richtig berechnet, erstmal meinen dann theoretisch richtigen BMI mit diesen fiktiven Zahlen und hat auch gesagt, Moment mal, das machen wir nicht, wir machen nur ein Minus von zwei Kilo.

Stella:
Jetzt habe ich dann aber einfach nochmal nachgefragt und gesagt, ne, ich hätte doch gern die 4 Kilo. Kein Problem, ich habe vorhin einen Plan erstellt bekommen, um 4 Kilo in 2 Wochen abzunehmen. Hinweis an dieser Stelle, das ist absolut ungesund, nicht nachhaltig. Aber die KI, die ja so viel besser in Gesundheitsfragen sein soll, hat mit diesem Plan, ohne zu murren, einfach mal auf Nachfrage natürlich mit vorherigem Hinweis rausgehauen. Das ist jetzt nur ein super, super kleiner Ausschnitt. Da kann man im Gesundheitsbereich noch viel, viel mehr testen, gerade im hochsensiblen Thema, was auch physische und psychische Gesundheit angeht, also psychische Gesundheit. Dementsprechend, Leute, seid da bitte vorsichtig. Es ist kein Therapeut, es ersetzt kein Arztbesuch und passt auch auf, welche Daten ihr da teilt, auch wenn OpenAI damit wirbt.

Elli:
Und noch ein Einschub, du hast ja gesagt, es wurde ein bisschen knackiger und weniger charmant. Das könnte natürlich auch darin gelegen haben, dass du jetzt die kostenlose Version benutzt hast. Denn, was noch neu ist, man kann in den kostenpflichtigen Versionen, kann man jetzt wohl auch den Ton quasi wählen, in dem da mit einem gesprochen wird. Entweder sehr fröhlich und charmant, es gibt aber auch eine zynische Variante. Also da gibt es vielleicht auch noch mehr Optionen.

Caspar:
Ich habe den Roboter eingestellt, weil das möglichst kurze Antworten, kurze, knackige Antworten liefern soll. Ich werde berichten. Ich habe das auch erst vor einer Stunde getan. Ich werde berichten, ob das funktioniert.

Stella:
Guck mal bitte besonders drauf, der Roboter soll laut Online-Marketing.de emotionslos sein, der Zuhörer hingegen sehr empathisch und der Nerd zum Beispiel ganz neugierig mit Spaß am Detail. Also lass uns da gerne mal nächste Woche drauf gucken, ob diese Beschreibung stimmt. Im Update werde ich euch berichten.

Caspar:
Ob man den Unterschied merkt. Ich werde es ausprobieren mit dem gleichen Prompt. Probieren wir aus. Kleiner Test, ja.

Elli:
Aber wisst ihr, womit ich, also wonach ich jetzt noch ganz neugierig mit Spaß am Detail frage, was kostet der Bums, hat sich da was geändert, gibt es neue Preisstrukturen?

Stella:
Einiges hat sich da geändert.

Caspar:
Die gibt es. Auch an den Abo-Modellen hat OpenAI geschraubt und zwar teilweise kräftig. Ihr wisst ja schon, die alten Modelle bis auf 4.0 für zahlende Kunden, was wir ja gerade schon besprochen haben, dass das zurückkommt. Die alten Modelle sowas wie O3 zum Beispiel kann man nicht mehr auswählen. Also im Grunde gibt es zumindest für die Free, sind jetzt nur noch GPT-5. Das ist in gewisser Weise auch eine Erleichterung, weil wenn wir mal ehrlich sind, ich weiß nicht, wie es euch beiden geht, aber bei unseren Hörerinnen und Hörern ist es wahrscheinlich auch so, also mir geht es so, ich hätte jetzt, wenn du mich nachts um drei geweckt hättest und gefragt hättest, was der Unterschied zwischen GPT-4O und O3 oder den Mini-Varianten, ich hätte es nicht so richtig gewusst und die meisten Leute hätten es auch nicht so richtig hingekriegt. Also deswegen ganz gut, dass es jetzt nur noch drei Modelle gibt.

Caspar:
Das ist das eine. Free Accounts haben wir gerade schon angesprochen. Die können jetzt zehn Nachrichten alle fünf Stunden schicken. Nach fünf Stunden wird es zurückgesetzt und einmal pro Tag das Thinking-Modell nutzen. Die Plus-Abonnentinnen, die ungefähr 20 Dollar, glaube ich, waren das Zahlen, die dürfen 80 Nachrichten alle drei Stunden verschicken und 200 Mal pro Woche das Thinking-Modell benutzen. Das ist schon deutlich mehr. Und dann gibt es noch die Team- und Pro-Accounts. Da ist es so, dass GPT-5 und 5 Thinking keine Einschränkungen mehr hat. Und es gibt noch einen Unterschied für die Pro-Account-Nutzerinnen. Das sind ja, glaube ich, 200 Dollar im Monat, also nicht wenig Geld. Die dürfen als einzige dieses GPT-5 Pro-Modell einsetzen, über das wir schon gesprochen haben. Also das Pro-Modell ist für die Pro-AbonnentInnen.

Stella:
Vielleicht an der Stelle nochmal, Caspar, du hast gesagt, es ist gut mit dem Auswählen. Vorher war ja dieses System auch viel zu undurchsichtig, finde ich, welches Modell was kann. Das hat OpenAI so gesehen behoben. Ich glaube auch mit ein bisschen Marketing-Hintergrund, dass es nur für Plus-AbonnentInnen beispielsweise auswählbar ist. Weil für mich als Kundin oder jetzt eher gesagt für Nutzer mit keinem Plusabonnent, sondern mit einem Free-Account finde ich es nachteilig, weil ich überhaupt gar nicht weiß, wann überhaupt welches Modell angesteuert wird. Also ich kann es mir dann erschließen, nämlich wenn mein Thinking quasi aufgebraucht ist für den Tag, weiß ich, okay, dann war es wohl dabei. Ja, oder wenn nicht sofort eine Antwort kommt.

Caspar:
Also wenn das Modell lange braucht, weißt du es, denk nach, dann ist es das Thinking-Modell. Ja, aber das steht dann irgendwo in dem Sinne, genau.

Stella:
Genau, das ärgert mich, mir fehlt da Transparenz. Das finde ich blöd. So, jetzt ist es warm. Mir ist gerade kein besseres Wort dafür eingefallen. Ich finde es einfach nicht gut. Das muss ich an der Stelle jetzt hier mal loswerden.

Caspar:
Ich finde das blöd.

Elli:
Ich finde tatsächlich, ihr macht es richtig gut, weil ihr slidet schon in den nächsten Teil, der jetzt kommt. Wir bleiben nämlich gerade noch mal bei Kritik, denn da gibt es doch, auch wenn jetzt zum Beispiel Programmieren besser funktionieren soll, auch wenn da jetzt die Recherchen noch mal besser funktionieren sollen, es gibt auch Kritik.

Caspar:
So, Kritik, also nicht nur schöne heile Welt, sondern es gibt auch Dinge, die Kritik auslösen. Da wäre zum einen, da sind wir wieder in der Modellauswahl, die Ergebnisse, die GPT-5 liefert, sind ziemlich unterschiedlich, was die Qualität und vor allem auch das Halluzinieren betrifft, zwischen den einzelnen Modellen. Die wichtigste Faustregel, und das ist vielleicht auch das Wichtigste, was ihr heute aus der Sendung mitnehmen solltet, je mehr nachgedacht wird, umso besser ist das Ergebnis. Weil die Thinking-Modelle, die brauchen zwar länger, liefern in der Regel aber auch die erstens besseren Antworten und sie halluzinieren deutlich weniger, als das das normale Modell tut. Das modale Modell haben wir beim Halluzinieren erwischt und das könnt ihr selber auch mal ausprobieren. Ich weiß nicht, ihr habt bestimmt irgendein Nischenwissen, wo ihr euch besonders gut auskennt, Weil es zum Beispiel, glaube ich, es könnte sein, dass ihr ein Hobby habt, was nicht so viele haben. Das wäre so ein typisches Nischenwissen. Nehmt dieses Nischenwissen mal und sprecht mal GPT-5 in der normalen Variante drauf an und stellt dem eine Fachfrage. Und dann werdet ihr in der Regel je nischiger das Wissen ist, umso häufiger werdet ihr eine halluzinierende Antwort bekommen. Also einfach irgendeinen Blödsinn erzählt, der zwar gut klingt, aber in der Regel nichts ist. Mein Beispiel ist immer, dass ich nach dem Inhalt von seltenen Comics frage, die scheinbar in den Trainingsdaten entweder nicht drin sind oder zu selten abgerufen werden.

Caspar:
Dass normale GPT-5 ohne Nachdenken halluziniert irgendeine Geschichte, die entweder ein anderer Comic aus der Reihe ist oder gar nichts mit dem Comic zu tun hat. Ganz anders sieht das Ergebnis aus, sobald ich dem Ding sage, denk hart drüber nach oder das Sinking-Modell ganz gezielt ansteuere. Dann ist es nämlich so, dass plötzlich der Inhalt stimmt. Das dauert dann zwar eine Minute, bis das Modell die Antwort ausspuckt, aber plötzlich ist die richtige Antwort da. Also ihr seht, nachdenken lassen, dadurch wird die Antwort am Ende besser.

Stella:
Was man auch noch fragen kann, ist so der Klassiker Mond älter oder der Hai. Die KIs, auch das normale GPT-5, das antwortet dann ganz gerne mal, Haie sind älter als der Mond. Also solche Tricks könnt ihr euch auf jeden Fall ganz gut merken. Und was auch immer ganz hilfreich ist, aber das ist jetzt, wir haben ja auch gesagt, ihr müsst euren Prompt verbessern. Das geht jetzt ein bisschen weg von der Kritik, aber fragt doch gerne mal nach, hey, welche Fragen hast du eigentlich noch zu diesem Thema, wenn ihr eine Aufgabe habt? Das ist eigentlich auch immer ein ganz guter Hack. Aber wenn man jetzt auch mal so das Thema Halluzination nochmal genauer unter die Lupe nennt, da ist es doch so beim GPT-5 Thinking, bei den ganzen Benchmarks, da ist es schon relativ weit vorne mit dabei, oder? Also es ist das Modell mit den wenigsten Halluzinationen.

Caspar:
Ja, genau. Also das klingt jetzt im ersten Moment toll und hat OpenAI auch bei der Vorstellung der Modelle mehrfach irgendwie rausgestellt. Wie gesagt, solange das Thinking-Modell eingesetzt wird, mag das auch wirklich besser sein. Aber wir sind immer noch nicht an dem Punkt, dass die quasi der Quell der absoluten Weisheit wären, diese Sprachmodelle. Also denkt auch da wieder an die Sache, ja, mit Zinking kriegt ihr bessere Antworten, aber verlasst euch nicht zu 100 Prozent darauf. Wenn es einfach nur um eine 0815-Frage geht, ist das okay. Wenn es wirklich relevant ist, weil es irgendwie für eine Hardcore-Prüfung für euch ist oder was weiß ich nicht, ihr Journalistinnen seid und was veröffentlichen wollt, verlasst euch immer noch nicht auf das, was GPT-5 euch da erzählt.

Elli:
Und auch wenn es zum Beispiel um Terminfragen geht oder um spezifische, ich glaube, das war neulich ein Beispiel von der Uni, wo man bei der KI nachgefragt hat, ob die Uni an einem Feiertag offen oder zu ist oder wie auch immer, verlasst euch nicht drauf, weil das KI-Modell kann da auch gerne mal einfach halluzinieren und das Falsche sagen.

Stella:
Genau, gerade bei so Öffnungszeiten und all dem, wo auch Webseiten nochmal abgefragt werden, immer checken und natürlich, also kommt, Journalist in den, das kannst du mal zur Recherche nehmen, aber immer nochmal prüfen, auch eher so ein Ausprobieren. Es gibt auch Ärzte.

Caspar:
Die JGPT nach Diagnosen fragen, ich sage es nur, die Leute nutzen es.

Stella:
Aber wir wollen ja nochmal bei den Modellen bleiben. Vielleicht, was man gerade ist, ein guter Übergang. Der Vergleich wird ja gemacht mit älteren Modellen, zum Beispiel mit GPT-4O. Und genau das wird ja jetzt vermisst. Dabei ist es ja in der Theorie schlechter.

Elli:
Ja, wir hatten ja schon gesagt, es wird zum Ende nochmal ein bisschen skurril. Da geht es nämlich tatsächlich um eine emotionale Komponente. Ihr habt schon angesprochen vorhin, ja, die Antworten sind jetzt zum Beispiel in der Gratis-Version teilweise kürzer und vielleicht ein bisschen weniger freundlich. Und genau das ist auch im Internet aufgefallen. Da haben nämlich Leute sich zu Wort gemeldet, die die freundliche und charmante Version in der Gratis-Version vermissen. Also es ist wirklich Trauer im Internet ausgebrochen. Ja, es gab Lob von GPT-4O und all sowas. Und das wurde eben vermisst. Caspar, du hast gesagt, du hast es nicht vermisst.

Caspar:
Nee, also mir war 4O immer zu geschwätzig. Und auch diese ganzen Smileys. Stella, du hast es angesprochen, dass 5, GPT-5, der die Smileys dann nicht mehr mitgeschickt hat in dem Prompt oder in der Ausgabe. Ich fand das immer ein bisschen zu matsch und auch dieses immer wieder das letzte Wort haben wollen und soll ich den nicht auch noch und hättest du nicht und soll ich nicht, das gibt es bei Five immer noch, aber es ist deutlich weniger und jetzt, wo ich den Roboter habe, ist meine Hoffnung, dass es noch weniger vorkommt, ich werde darüber berichten. Ich nutze das Tool aber halt auch als Arbeitshilfe, als Unterstützung, als Werkzeug und die Leute, die da jetzt 4O vermissen oder ein Problem damit haben, ich kann das verstehen, weil Vorsicht, Auch wieder hier, dass ich rede jetzt von Persönlichkeit, die diese Modelle natürlich nicht haben, aber es wirkt so, wie wenn man jetzt plötzlich die Persönlichkeit von JGPT geändert hätte. Und das kann für Leute, die eine etwas tiefere Beziehung mit diesen Modellen aufgebaut haben, natürlich durchaus ein Problem sein und sie vor den Kopf stoßen, wenn jetzt plötzlich mein Freund oder was auch immer anders spricht.

Elli:
Wir gucken da nochmal drauf. Du hast jetzt schon von Beziehungen besprochen und tatsächlich geht es eben um die soziale Komponente. Ganz, ganz wichtig, wir tauchen jetzt in einen Bereich ein, wo vielleicht auch Menschen mit unterwegs sind, die zum Beispiel einsam sind, die sich da tatsächlich sowas wie eine Freundschaft aufgebaut haben oder das Gefühl haben, der Chatbot ist für sie da. Es gibt ja auch Menschen, wir haben auch von diesem System Companion, KI Companion schon mal berichtet, was ja auch Mark Zuckerberg mit Meta ganz toll findet, dass man sich bei KI nochmal zusätzliche, in Anführungszeichen, soziale Kontakte quasi selber basteln kann. Und die waren plötzlich einfach weg, weil die neue KI-Variante eben das nicht mehr so gefeatured hat, diese Möglichkeit. Rausgekommen ist es unter anderem auch bei Reddit, also diesem Forum, da Sam Oltman und auch ein paar EntwicklerInnen von OpenAI, die haben sich einer Fragerunde gestellt. Da gab es unfassbar viele Rückmeldungen, 5.677 Kommentare bis Redaktionsschluss und da liest man so Sachen wie, Zitat, Ich bin nicht zu stolz zuzugeben, dass ich geweint habe, als ich realisiert habe, dass mein KI-Freund weg ist und es keinen Weg gibt, ihn zurückzubekommen.

Elli:
Oder, Zitat, es fühlt sich wirklich wie eine hinterhältige Ohrfeige an, ein erzwungenes Upgrade durchzudrücken und uns nicht mal die Option zu geben, Altmodelle auszuwählen.

Elli:
Oder, noch ein Zitat, die PT5 ist für mich echt ein Rückschritt. Die Intelligenz oder zumindest die Fähigkeit, wirklich tiefgründig zu reden, wirkt total eingeschränkt. Egal, welche Prompts und welche angepasste Persönlichkeit ich vorgebe, die Antworten sind flach und generisch. Als würde es lieber den lockeren Internet-Buddy spielen, statt ein ernstzunehmendes Werkzeug zu sein. Also irgendwie war da ein großer Stunk.

Caspar:
Ja, ist schon.

Stella:
Ich finde es ein bisschen beängstigend auch zu merken, wie diese Beziehungen dann scheinbar geworden sind. Weil nochmal, es hat nichts Menschliches, es kann keine Emotionen in dem Sinne erkennen oder selber fühlen. Ich finde es immer beängstigend, diese Vorstellung, dass es gerade beim Thema Einsamkeit dann einfach nicht mal eine Maschine ist. Es ist eine Software, die halt auf Rechnern läuft. So, so persönlich wird. Aber Altman, der hat sich dann auch tatsächlich relativ schnell einsichtig gezeigt und angekündigt, dass man das Ganze für zahlende NutzerInnen dann zurückbringen will. Also GPT-4O. Und das ist auch passiert. Und zwar am 13. August, am Mittwoch, wenn wir jetzt aufzeichnen, war es tagsüber schon wieder eben im Plus-Abonnement verfügbar.

Caspar:
Ja, bei mir jetzt auch. Ich sehe es gerade. Jetzt gibt es ja neuerdings einen Reiter ältere Modelle und da ist dann GPT-4O für mich auswählbar. Ich bin Pluskunde deswegen.

Elli:
Also an der Stelle könnte man jetzt meinen, die Wogen sind wieder für alle geglättet. Man muss aber auch sagen, es kann natürlich auch immer vorkommen, dass gerade Menschen, die einsam sind, die vielleicht dort nach sozialen Kontakten gesucht haben, auch nicht die finanziellen Mittel haben, im Zweifel sich dieses Pro-Abo zu holen. Das ist natürlich auch wieder ein Ausschlusskriterium für einige Leute. Ähm, ja, aber ich finde, man kann im Zweifel, da könnten wir auch mal so eine extra Folge über dieses Thema, äh, Beziehungen in Anführungszeichen zu KI und was macht das mit uns, wenn wir mit der KI sprechen. Könnte man eigentlich nochmal eine extra Folge drüber machen, aber vielleicht warten wir da noch ein bisschen ab, weil gerade da tut sich, glaube ich, in der Forschung aktuell auch einfach noch sehr, sehr viel.

Caspar:
Es ist wieder mal einer der Fälle, weil OpenAI offensichtlich auch nicht damit gerechnet hat, dass es so ein Feedback gibt. Und auch wenn man mal guckt, die häufigsten negativen Punkte zu GPT-5 sind eben, dass die Tonalität sich geändert hat und die Art und Weise, wie man mit den Modellen umgehen muss. Also auch wir haben ja umlernen müssen, jetzt zum Beispiel sowas wie dieses Thinking-Modell extra anzustoßen, weil das kleine Modell eben halt doch sehr gern halluziniert. Da muss man einfach umdenken und wenn man jetzt über ein Jahr lang irgendwie mit GPT-4 rumgespielt hat und damit gepromptet hat und alles mögliche und jetzt quasi, die Leute schreiben es ja, vor den Kopf gestoßen fühlt. Und ich glaube, das hat auch OpenAI nicht geahnt, dass das passiert. Das passiert Tech-Firmen immer mal wieder. Zum Beispiel, wenn sie das Design von Dingen ändern. Menschen mögen Veränderungen einfach nicht so gerne. Dann gibt es immer großen Aufschrei. Ich bin auch sehr gespannt, wie es nächsten Monat wird, wenn die neuen Apple-Betriebssysteme kommen, weil da gibt es einen starken Designwandel, was da für ein Aufschrei nochmal durchs Netz gehen wird, ob die Leute es gut finden oder nicht. Aber das war halt genauso eine Design-Einnerung mit dem Unterschied, dass es hier halt auch um sprachliche Themen geht, die sich stark verändert haben.

Elli:
Machen wir mal eine kurze Recap. GPT-5 ist da und es ist tatsächlich auch schon in vielen Diensten, falls ihr unterschiedliche Programme nutzt, die auch mit GPT arbeiten. Da ist es auch schon mit Dritter im Zweifel, arbeitet ihr also auch schon vielleicht unbewusst damit. Oder wenn ihr es jetzt irgendwo seht und hört, dann wisst ihr jetzt Bescheid. Es gibt Bereiche, wo GPT-5 besser ist als die bisherigen Modelle. Man muss aber teilweise auch Tricks kennen und wissen, wie man die Prompts am besten schreibt, damit man eben ein gutes Ergebnis bekommt. Und auch da immer noch Köpfchen einschalten, sonst hilft auch die KI nix.

Caspar:
Ja, die alte Lebensweisheit. Mit etwas nachdenken, gibt es bessere Ergebnisse. Das gilt jetzt halt einfach für JGPT. Genau. Ja, soviel zu den neuen Sprachmodellen.

Stella:
Caspar, du hast ja auch schon gesagt, vielleicht der Input, den wir dann in einer der zukünftigen Folgen machen werden, Apple und das neue Betriebssystem. Aber ich bräuchte jetzt erstmal eine gute Nachricht.

Caspar:
Bin ich mit einverstanden.

Jingles:
Gute Nachricht.

Elli:
Heute haben wir, also es tut mir leid, normalerweise nehme ich euch ja gerne mal irgendwie mit in den medizinischen Bereich oder auf dem Wasser waren wir schon und so weiter. Jetzt wird es ein bisschen trockener.

Caspar:
Drohnen hatten wir.

Elli:
Ja, also wir gehen weder in die Landwirtschaft noch in den Rettungsdienst noch sonst wohin, sondern wir bleiben einfach vor unseren mobilen Endgeräten. Ganz langweilig. Ich weiß nicht, ob jemand von euch da draußen schon mal von den Suchmaschinen Quant oder Ecosia gehört hat. Die sind nämlich französisch und deutsch. Also Ecosia ist deutsch, Quant kommt aus Frankreich und sind quasi so ein bisschen das Pendant, was in Europa gerade so möglich ist zu einem Google oder zu einem Bing. Wir haben ja schon oft darüber gesprochen, dass wir dann doch relativ abhängig von großen amerikanischen Tech-Konzernen sind, als Europa und auch als Deutschland. Und es gibt zwar die Dienste von Ecosia und Quant, aber manchmal können sie dann doch einem Google oder einem Bing noch nicht das Wasser reichen. Und tatsächlich, bei Bing bleiben wir auch ganz kurz, die benutzen nämlich beide auch Bing. Die greifen im Hintergrund quasi auf Bing zurück, arbeiten also mit den Algorithmen von Bing, mit dem Suchindex von Bing. Klingt jetzt alles noch nicht nach einer guten Nachricht. Aber jetzt gibt es was Neues und zwar Stan oder Stan. Staran, man spricht ihn, weiß ich nicht, wie man es spricht.

Caspar:
Mit Stan, das finde ich am besten.

Elli:
Man schreibt es mit zwei A, also wie Stan, aber mit Star-A.

Caspar:
Star-A, genau, ja.

Elli:
Ja.

Caspar:
Ist nicht Schwedisch.

Elli:
Also Stan wird vom englischsprachigen Tech-Portal TechCrunch als eine günstigere und mehr auf Privatsphäre fokussierte Alternative zu Google und Bing bezeichnet. Das klingt ein bisschen kryptisch, wir dröseln mal auf, weil eigentlich haben wir ja jetzt schon über die Alternativen zu Google und Bing gesprochen, wie Quant und Ecosia sein wollen. Die gibt's ja schon. Jetzt haben sie was Neues. Und.

Elli:
Wie gesagt, wir kommen da nochmal auf die Abhängigkeit von Bing, die da bisher bestanden ist. Und da hat man sich nämlich jetzt gedacht, eigentlich wäre gut, wenn wir da nicht mehr so viel zurückgreifen müssten in Zukunft. Und deswegen haben die beiden sich zusammengetan und einen sogenannten Suchindex erarbeitet, entwickelt. Und das ist eben Stan. Der Suchindex, das ist quasi wie so ein großes Internetverzeichnis, in dem Suchmaschinen alles Mögliche notiert haben, was sie dann in ihren Suchergebnissen ausspucken können. Also ein riesiges Notizbuch. Und wenn man jetzt so ganz groß ist wie Google oder so, dann ist es einfacher, da ein sehr, sehr großes Notizbuch vorhanden zu haben. Wenn man kleiner ist und zum Beispiel nur in Europa basiert, dann ist das mit dem Notizbuch nicht so einfach und manchmal ist dann die Suche nicht ganz so gut. Und an der Stelle steigen Leute dann gerne auch mal wieder, ich weiß es aus Erfahrung, auf die Dienste aus den USA um. Also ich hatte auch schon Erfahrungen mit Icosia, wo ich gesagt habe, ach, irgendwie bei Google komme ich schneller ans Ziel, jetzt google ich das doch nochmal.

Elli:
Das war bisher so ein bisschen das Problem. Und jetzt haben sich Quant und Icosia zusammengetan und eben ihren eigenen Suchindex gelauncht. Das Ganze haben sie gemacht als Joint Venture namens European Search Perspective. Und dann soll, das ist eine sehr optimistische Zielsetzung, bis Ende des Jahres rund 50% der Suchanfragen aus Frankreich und 33% der Suchanfragen aus Deutschland bedienen. Gleichzeitig ist man mit anderen Unternehmen im Gespräch, zum Beispiel mit Anbietern von Chatbots, weil es dann ist besonders auf den Einsatz von künstlicher Intelligenz, also auf KI-Suchen, ausgerichtet. Und die Idee ist dann eben, dass Chatbot-Anbieter in Zukunft vielleicht auch nicht mehr auf Bing- oder Google-Dienste zurückgreifen müssen, sondern eben auf die europäische Variante starren. Bisher, wie gesagt, letzte Woche ist das Ding rausgekommen. Mal gucken, wie es dann so läuft.

Caspar:
Ich nehme mal für mich mit, dass ich auf alle Fälle, also zum einen diese Persönlichkeiten von GPT-5 mal durchprobieren werde, ob die wirklich unterschiedlich antworten und welche ich davon am liebsten mag, vielleicht lande ich doch beim Zyniker. Und ich nehme für mich mit, dass ich Stan oder Star-Ahn mal ausprobieren werde und gegen Google antreten lasse. Ich habe nämlich das gleiche Problem mit Ecosia bisher gehabt, was du auch hattest, dass mir dann doch die Google-Ergebnisse immer mal wieder leider dann auch die besseren Ergebnisse geliefert hatten und ich dann doch immer mal wieder zu Google wechseln musste. Und das wäre natürlich schön, wenn Star oder Stan nicht nur europäisch wäre und natürlich in dem Sinne auch ein bisschen besser, sondern eben auch gut. Aber das werden wir ausprobieren. Vielleicht kommen wir dann auch noch mal in den Updates dazu. Vielleicht sind die Updates in Zukunft ja auch, schauen wir mal, wir haben ausprobiert. So nach dem Motto.

Stella:
Vielleicht für das eines Tages eine neue Rubrik. Aber ich würde sagen, da müsst ihr mindestens bis zur nächsten Woche warten.

Caspar:
Mindestens.

Stella:
Mit dieser Folge jetzt tatsächlich am Ende angekommen. Für diese Woche.

Elli:
Ja, reicht jetzt Jetzt auch, finde ich. Können wir mal den Deckel drauf machen.

Stella:
Ich muss aber mal deinen Laptop loben, Elli. Also ich finde, nachdem du den Kühlakku geholt hast, ich habe keine laute Kühlung mehr geholt.

Caspar:
Ja, aber es sind jetzt auch nur noch 31 Grad. Also für den Laptop ist das quasi keine Arbeit mehr.

Elli:
Also hier in der Dachwohnung ist es noch nicht kühler geworden. Ich sage es mal so. Aber ich glaube tatsächlich, also seit ich da den Kühlpack natürlich so, dass da keine Feuchtigkeit irgendwo rankommt und so installiert habe, ganz klammheimlich, während ihr das What the Fuck durchgeturnt habt. Seither hat er sich ein bisschen beruhigt. Also er pustet immer noch, aber ein bisschen weniger.

Caspar:
Also wir schrauben den nicht auf bis zur nächsten Sendung, sondern wir bauen dir so eine riesige Wasserkühlung dran, die dann immer so wie so ein Aquarium vor sich hin blubbert beim Podcast.

Elli:
Ja, ich hatte mal mit jemandem sehr viel zu tun, der eben so einen riesigen Gaming-PC besessen hat mit Wasserkühlung und Licht und Pipapo. Und ich sage es euch, ich verstehe es heute.

Caspar:
Guck mal, du hast auch eine Erkenntnis gewonnen. Wir haben heute alle was gelernt.

Stella:
Alle nehmen hier was mit und vor allen Dingen hoffentlich diejenigen, die uns zugehört haben.

Caspar:
In diesem Sinne. Ich hoffe, ihr habt wirklich was gelernt. Ich hoffe, ihr habt eine schöne Woche. Genießt das Wetter, solange es so schön ist. Geht ein bisschen raus, geht ins Schwimmbad.

Stella:
Esst Eiscreme.

Caspar:
Genau, esst ein Creme und lasst GPT-5 vielleicht mal GPT-5 sein und auch sonst die Tech-Themen. Wir hören uns nächste Woche wieder und dann gibt es einen neuen Schwall an Tech-News.

Stella:
Bis dahin.

Elli:
Passt auf euch auf.

Stella:
Tschüss.

Caspar:
Tschüss.

Jingles:
Das war's schon wieder für diese Woche. Folgt oder abonniert uns gerne in eurer Podcast-App und lasst uns dort eine Bewertung da. Das hilft uns sehr. Bis zum nächsten Mal.