{"id":265727,"date":"2025-04-04T22:52:15","date_gmt":"2025-04-04T20:52:15","guid":{"rendered":"https:\/\/infodienst.info\/?p=265727"},"modified":"2025-07-24T18:39:17","modified_gmt":"2025-07-24T16:39:17","slug":"ein-ki-modell-hat-offiziell-den-turing-test-bestanden","status":"publish","type":"post","link":"https:\/\/infodienst.info\/?p=265727","title":{"rendered":"Ein KI-Modell hat offiziell den Turing-Test bestanden"},"content":{"rendered":"<p style=\"text-align: left;\"><span style=\"color: #000000;\">Wahrscheinlich zum ersten Mal haben branchenweit f\u00fchrende sog. \u00bbgro\u00dfe Sprachmodelle\u00ab (Large Language Models, kurz: LLMs) den Turing-Test bestanden, der seit langem als etablierte Methode des Nachweises gilt, ob Maschinen menschen\u00e4hnliche Intelligenz entwickelt haben.<\/span><\/p>\n<p style=\"text-align: left;\"><span style=\"color: #000000;\">In der neuen Vorabstudie \u00bb<\/span><a href=\"https:\/\/arxiv.org\/abs\/2503.23674\">Large Language Models Pass the Turing Test<\/a><span style=\"color: #000000;\">\u00ab, die noch kein Peer Review durchlaufen hat, berichten die Forscher am Language and Cognition Lab der UC San Diego, Cameron R. Jones und Benjamin K. Bergen, von ihren Ergebnissen mit den vier Systemen ELIZA, GPT-4o, LLaMa-3.1-405B und GPT-4.5. In einer \u00bbDrei-Parteien-Version\u00ab des Turing-Tests, bei dem die Teilnehmer gleichzeitig mit einem Menschen und einer KI chatten und anschlie\u00dfend beurteilen, wer von beiden der Mensch ist, wurde das GPT-4.5-Modell von OpenAI in 73 Prozent der F\u00e4lle als Mensch angesehen. Das ist deutlich h\u00f6her als die Zufallswahrscheinlichkeit von 50 Prozent und deutet darauf hin, dass der Turing-Test eindeutig bestanden wurde.<\/span><\/p>\n<p style=\"text-align: left;\"><span style=\"color: #000000;\">Konkret f\u00fchrten die Teilnehmer gleichzeitig f\u00fcnfmin\u00fctige Gespr\u00e4che mit einem anderen menschlichen Teilnehmer und einem dieser KI-Systeme, bevor sie entschieden, welchen Gespr\u00e4chspartner sie f\u00fcr einen Menschen hielten. Als GPT-4.5 aufgefordert wurde, eine menschen\u00e4hnliche Rolle einzunehmen, wurde es in 73 Prozent der F\u00e4lle als Mensch eingestuft: signifikant h\u00e4ufiger, als die Befrager auf die echten menschlichen Teilnehmer tippten. LLaMa-3.1 wurde bei gleicher Aufforderung in 56 Prozent der F\u00e4lle als Mensch eingestuft \u2013 nicht signifikant h\u00e4ufiger oder seltener als die Menschen, mit denen sie verglichen wurden \u2013, w\u00e4hrend die Basismodelle (ELIZA und GPT-4o) Zustimmungsraten erzielten, die deutlich unter dem Zufallswert lagen (23 % bzw. 21 %). Die Ergebnisse stellen den ersten empirischen Beweis daf\u00fcr dar, dass ein k\u00fcnstliches System einen standardm\u00e4\u00dfigen Drei-Parteien-Turing-Test bestehen kann. Die Ergebnisse haben Auswirkungen auf die Debatten dar\u00fcber, welche Art von Intelligenz gro\u00dfe Sprachmodelle (LLMs) aufweisen und welche sozialen und wirtschaftlichen Auswirkungen diese Systeme wahrscheinlich haben werden.<\/span><\/p>\n<p style=\"text-align: left;\"><span style=\"color: #000000;\">Der Turing-Test ist nach dem britischen Mathematiker und Informatiker<\/span> <a href=\"https:\/\/gi.de\/persoenlichkeiten\/alan-turing\">Alan Turing<\/a> <span style=\"color: #000000;\">benannt. Turing schlug 1950 vor, die Intelligenz einer Maschine zu testen, indem man sie textbasierte Gespr\u00e4che mit einem menschlichen Fragesteller f\u00fchren l\u00e4sst, der gleichzeitig \u2013 au\u00dfer Sichtweite \u2013 ein weiteres Gespr\u00e4ch mit einem anderen Menschen f\u00fchrt. Konnte der Fragesteller nicht korrekt bestimmen, welcher Befragte der Computer und welcher der Mensch war, deutete dies ganz allgemein darauf hin, dass die Maschine wie ein Mensch denken k\u00f6nnte.<\/span><\/p>\n<p style=\"text-align: left;\"><span style=\"color: #000000;\">In dieser neuesten <a href=\"https:\/\/arxiv.org\/pdf\/2503.23674\" target=\"_blank\" rel=\"noopener\">Studie<\/a> f\u00fchrten die Forscher das ber\u00fchmte Experiment auf einem Online-Portal durch. Acht Runden lang wurden knapp 300 Teilnehmer nach dem Zufallsprinzip entweder als Befrager oder als einer der beiden verh\u00f6rten \u00bbZeugen\u00ab ausgew\u00e4hlt, wobei der andere \u00bbZeuge\u00ab ein Chatbot war.<\/span><\/p>\n<p style=\"text-align: left;\"><span style=\"color: #000000;\">Die Ergebnisse sind faszinierend. Doch so hochgelobt der Turing-Test in KI- und Philosophiekreisen auch ist, er ist kein eindeutiger Beweis daf\u00fcr, dass eine KI menschlich denkt. Trotz all ihrer Schw\u00e4chen sind LLMs Meister der Konversation, trainiert mit unfassbar gro\u00dfen Mengen von menschlich verfasstem Text. Selbst auf eine Frage, die sie nicht verstehen, finden LLMs eine plausibel klingende Antwort.<\/span><\/p>\n<p style=\"text-align: left;\"><span style=\"color: #000000;\">Zwar deutet immer mehr darauf hin, dass KI-Chatbots Menschen hervorragend nachahmen k\u00f6nnen. Doch Forschungsleiter Cameron R. Jones glaubt nicht, dass die Implikationen seiner Forschung \u2013 ob LLMs so intelligent wie Menschen sind \u2013 eindeutig sei. \u00bb<em>Ich denke, das ist eine sehr komplizierte Frage \u2026<\/em>\u00ab, twitterte er. \u00bb<em>Aber im Gro\u00dfen und Ganzen denke ich, dass dies als ein Beweis unter vielen anderen f\u00fcr die Art von Intelligenz gewertet werden sollte, die LLMs an den Tag legen.<\/em> (\u2026) <em>Die Ergebnisse liefern meiner Meinung nach weitere Belege daf\u00fcr, dass LLMs in kurzen Interaktionen Menschen ersetzen k\u00f6nnten, ohne dass es jemand merkt<\/em>\u00ab, f\u00fcgte er hinzu. \u00bb<em>Dies k\u00f6nnte m\u00f6glicherweise zur weiteren Automatisierung von Arbeitspl\u00e4tzen, raffinierteren Social-Engineering-Angriffen und sonstigen allgemein-gesellschaftlichen Umbr\u00fcchen f\u00fchren.<\/em>\u00ab<\/span><\/p>\n<p style=\"text-align: left;\"><span style=\"color: #000000;\">Jones betonte abschlie\u00dfend, dass der Turing-Test nicht nur hilft, Maschinen unter die Lupe zu nehmen, sondern auch die sich st\u00e4ndig weiterentwickelnde Art und Weise der menschlichen Wahrnehmung von Technologie. Die Ergebnisse seien also nicht statisch: M\u00f6glicherweise werde die \u00d6ffentlichkeit mit zunehmender Vertrautheit im interaktiven Umgang mit KIs auch besser darin, diese aufzusp\u00fcren, zu erkennen und sich nicht mehr so leicht blenden zu lassen.<\/span><\/p>\n<p style=\"text-align: left;\"><span style=\"font-size: 8pt; color: #000000;\"><small>\u00a9 \u203aInfodienst fut\u016brum\u2039. Alle Rechte vorbehalten, all rights reserved. Nachdruck und Weitergabe an Dritte untersagt.<\/small><\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Wahrscheinlich zum ersten Mal haben branchenweit f\u00fchrende sog. \u00bbgro\u00dfe Sprachmodelle\u00ab (Large Language Models, kurz: LLMs) den Turing-Test bestanden, der seit langem als etablierte Methode des Nachweises gilt, ob Maschinen menschen\u00e4hnliche Intelligenz entwickelt haben. In der neuen Vorabstudie \u00bbLarge Language Models Pass the Turing Test\u00ab, die noch kein Peer Review durchlaufen hat, berichten die Forscher am&nbsp;&hellip;<\/p>\n","protected":false},"author":1,"featured_media":265728,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[61],"tags":[392,389,394,390,391,393,388],"class_list":["post-265727","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ai-ki","tag-chatbots","tag-eliza","tag-gpt-4-5","tag-gpt-4o","tag-large-language-models","tag-llama-3-1-405b","tag-turing-test"],"_links":{"self":[{"href":"https:\/\/infodienst.info\/index.php?rest_route=\/wp\/v2\/posts\/265727","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/infodienst.info\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/infodienst.info\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/infodienst.info\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/infodienst.info\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=265727"}],"version-history":[{"count":4,"href":"https:\/\/infodienst.info\/index.php?rest_route=\/wp\/v2\/posts\/265727\/revisions"}],"predecessor-version":[{"id":630864,"href":"https:\/\/infodienst.info\/index.php?rest_route=\/wp\/v2\/posts\/265727\/revisions\/630864"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/infodienst.info\/index.php?rest_route=\/wp\/v2\/media\/265728"}],"wp:attachment":[{"href":"https:\/\/infodienst.info\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=265727"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/infodienst.info\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=265727"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/infodienst.info\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=265727"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}