Hervorragende Software und praktische Tutorials
So implementieren Sie die ChatGPT-Anwendung. Künstliche Intelligenz ist nur der Anfang, die zukünftige Entwicklungsrichtung von ChatGPT
ChatGPT-Entwicklungsrichtung web3 Der Grund für die schwierige Implementierung liegt darin, dass es schwierig ist, eine Lösung für die Anwendung von Web3 zu finden. ChatGPT Im Gegenteil: Anwendungen, die auf dem leistungsstarken Sprachmodell von ChatGPT basieren, werden schnell aktualisiert und iteriert und erreichen schließlich die Nutzer. Dies könnte der Grund für die große Beliebtheit von ChatGPT-Chatbots sein. ChatGPT ist zufällig, unvorhersehbar und kreativ, was den Unterschied von ChatGPT unterstreicht.
ChatGPT-Entwicklungsrichtung: Kombination von Ideen, die Menschen nicht umsetzen können
Wenn es etwas gibt, das ChatGPT so großartig macht – und dem Menschen deutlich überlegen ist – dann ist es die Art und Weise, wie es unterschiedliche Ideen nahtlos zu einem homogenen Ganzen verbindet. Ich spreche von Dingen wie:
Dies ist wohl die herausragendste Fähigkeit von ChatGPT. Es ist nicht nur ein großartiges Tool, sondern (neben anderen LMs) auch das einzige, das dies kann. Selbst Menschen – darunter Experten, die sich mit Prompt-Konzepten (z. B. Bubblesort-Algorithmen und Gangsterfilmen) auskennen – können dies nicht ohne weiteres.
Hier ist ein weiteres Beispiel. Ich bat ChatGPT, ein Shakespeare-Sonett zu schreiben, mit ungeraden Zeilen für den Morgenkaffee und geraden Zeilen für Tukane, aber auf eine Weise, die stimmig und kohärent wirkt (nur aus Neugier: Shakespeare starb 1616, und Tukane wurden erstmals 1776 taxonomisch beschrieben, was dieses Gedicht historisch unmöglich macht). Hier ist das Ergebnis nach einigen Versuchen (sogar das Reimschema – ABAB CDCD EFEF GG – ist nahezu perfekt):
ChatGPT wurde anhand einer großen Menge an Textdaten trainiert, daher wird erwartet, dass es eine große Anzahl von Themen versteht – die in seinen Milliarden von Parametern irgendwie repräsentiert sind. In gewisser Weise funktioniert unser Gehirn ähnlich. Das Abrufen von Erinnerungen unterscheidet sich nicht wesentlich von der Verwendung eines Hinweises, um die LM-Ausgabe zu etwas Bestimmtem zu machen (beachten Sie, dass ich keine Parallelen in Struktur oder gar Funktionalität ziehe, sondern im Prinzip).
Das nahtlose Vermischen zweier oder dreier Themen ist jedoch nicht die Fähigkeit des menschlichen Gehirns. ChatGPTs Fähigkeit ist „heterogen“ (in dem Sinne, dass es in seinen Fehlern heterogen ist). Die Art und Weise, wie es Schreibstile, unterschiedliche Themen oder Ideen, die noch nie zuvor zusammengeführt wurden, zu einzigartigen Werken mit semantischem Zusammenhalt kombiniert, ist beeindruckend. Für mich verkörpert dies die kreativen Qualitäten von LM. Im Gegensatz dazu würden Menschen – selbst die erfahrensten – Schwierigkeiten haben, solche Mischungen konsistent zu erstellen. Unser Gehirn ist für diese Aufgabe nicht gut geeignet, ChatGPT hingegen schon.
Dieses Phänomen ist eine Folge der Darstellung von Konzepten im latenten Raum von ChatGPT. Durch Eingabeaufforderungen können wir auf diese Informationen zugreifen, was dem menschlichen Gedächtnis nicht möglich ist (zumindest nicht nach Belieben – wer weiß, was wir aus dem Gedächtnis einer Person herausholen könnten, wenn wir sie wie mit ChatGPT aufrufen könnten).
ChatGPT-Entwicklungsrichtung, ändern Sie den von Ihnen erstellten Inhalt
Menschen sind gut darin, Ideen gründlich zu erforschen, und hier schwächelt ChatGPT. Deshalb empfehle ich es nicht für das Schreiben solcher Artikel, egal ob es sich um eine E-Mail, einen Tweet oder ein Buch handelt.
Ich bin jedoch bereit, es zur Konvertierung zwischen diesen Formaten zu verwenden. Bei routinemäßigen Verwaltungsarbeiten habe ich den einzigen Vorteil dieses ChatGPT festgestellt.
Die sprachliche Form ist großartig, aber die Kohärenz ist schrecklich (ganz zu schweigen davon, dass die Ergebnisse weder innovativ noch ansprechend sind). Es ist nützlich, um bereits Vorhandenes zu bearbeiten, aber schrecklich, um Neues zu schaffen, das nur einen minimalen Bezug zur Realität erfordert.
Wenn ich „Konvertierung zwischen Formaten“ sage, fällt mir als erstes dieses Bild ein, das ich für sehr praktisch und sicher halte:
Wenn wir diese Idee auf alles andere übertragen, sehen wir, dass ChatGPT sich hervorragend eignet, um Artikel in Aufzählungspunkten zusammenzufassen (was ich für Artikel empfehle, die Sie selbst schreiben), Absätze im Grammatikstil neu zu schreiben (aber nicht von Grund auf) oder Inhalte plattformübergreifend anzupassen (z. B. einen Substack-Artikel in einen LinkedIn-Beitrag und dann in einen Twitter-Thread umzuwandeln).
Der Schlüssel liegt hier in perfekter Information. Wenn Sie etwas geschrieben oder erstellt haben, wissen Sie alles darüber. Es ist für ChatGPT unbedenklich, den Inhalt zu ändern, da Sie es bemerken, sobald eine Idee oder ein Konzept nicht Ihrer ursprünglichen Absicht entspricht. Dies funktioniert auch gut, wenn Sie Experte auf dem Gebiet sind (obwohl Sie in diesem Fall, wenn Sie einen Fehler finden, daran zweifeln werden, ob er von ChatGPT oder dem menschlichen Autor stammt).
Wenn Sie einen Artikel lesen und möchten, dass ChatGPT ihn zusammenfasst, gelingt Ihnen das möglicherweise. Je weiter Sie jedoch vom Inhalt (oder Wissen) entfernt sind, desto schwieriger wird es, Fehler zu erkennen. Ich persönlich würde dies nur bei selbstgeschriebenen Texten in Betracht ziehen (ich habe es noch nicht ausprobiert).
ChatGPT-Entwicklungsrichtung, KI-Kunstmodell
Ist Ihnen aufgefallen, dass die Qualität meiner Titelbilder in letzter Zeit besser geworden ist? ChatGPT kann den latenten Raum von Midjourney viel besser erkunden als ich. Nicht, weil es versteht, gute Eingabeaufforderungen zu erstellen, sondern weil es Muster erkennt. Alle reinen Deep-Learning-Modelle verfügen über diese Fähigkeit (im Grunde ist es das Einzige, was sie tun – Mustererkennung), und beim Prompt Engineering dreht sich alles um Muster.
Um gute Midjourney-Eingabeaufforderungen von ChatGPT zu erhalten (GPT-3 funktioniert bei einer anderen „Volllast“ genauso gut …), beschreibe ich die Aufgabe, füge ein paar Beispiele hinzu (ich erhalte Bildeingabeaufforderungen aus dem Midjourney-Community-Feed) und gebe dann das gewünschte Thema an. Dies ist die Eingabeaufforderung, die ich derzeit verwende:
„Schreiben Sie eine gute Eingabeaufforderung für ein KI-System, das Bilder aus Text erstellt (Midjourney). Das Bild ist das Cover eines Artikels über [Thema Ihrer Wahl].
Hier sind drei typische Eingabeaufforderungen:
- „Der weite Himmel, alle möglichen glitzernden Erinnerungen, aneinandergereiht zu einem riesigen Nordlicht, wie leuchtende Blätter, weiß, orange, extrem schön, wunderschöne kosmische Verzerrung, wunderschöner Einbruch der Nacht, filmähnliche Beleuchtung, wunderschöne Felder, HD, hohe Qualität, ultradetailliert.“
- „Kniender Katzenritter, Porträt, detaillierte Rüstung, kompliziertes Design, Silber, Seide, filmische Beleuchtung, 4k.“
- „Superscharfe, preisgekrönte Unterwasser-Naturfotografie, Frau reitet auf einem Seepferdchen mit Glitzerverlauf, Gegenlicht, Tiefenschärfe, Meeresboden, üppige Vegetation, Partikel, Sonnenstrahlen, Korallen, Goldfische, Unterwasser-Modefotografie, Frau reitet auf einem Seepferdchen, superscharfe, preisgekrönte Fotografie.“
Sie können verschiedene Wörter oder Konzepte verwenden. Schreiben Sie einfach eine Eingabeaufforderung.
Schauen wir uns nun einige Bilder an. Zur Veranschaulichung verwende ich den Namen eines meiner Lieblingsmusikalben als Betreff (der Platzhalter „Betreff“ kann durch fast alles ersetzt werden):
Die Schönheit hinter dem Wahnsinn The Weeknd
„Ein chaotischer Wirbel aus verrückten Farben und Mustern vereint sich zu einem wunderschönen und komplexen Schmetterling, der die Schönheit dahinter symbolisiert: dramatische Beleuchtung, hohe Auflösung, abstrakter Expressionismus.“ – Abschnitt 4
Zurück in Schwarz Die Rolling Stones
Eine stilisierte Schwarz-Weiß-Illustration eines Gitarristen vor einer Wand aus Verstärkern, hinter denen Rauch aufsteigt, als würde er ein Konzert in einem Underground-Club spielen. Kleidung und Gitarre des Gitarristen sollten elegant und stilvoll sein, während der Verstärker groß und imposant ist und ein Gefühl von roher Kraft vermittelt. Kombinieren Sie Strichzeichnungen und Schattierungen, um ein Bild im Stil einer Graphic Novel zu kreieren, mit einem leuchtend roten Akzent auf der Gitarre als Akzent. – Abschnitt 4
Fühle Jaymes Young
Dieses abstrakte Gemälde fängt das Gefühl, etwas zu fühlen, durch eine Mischung aus warmen und kühlen Farben, kräftigen Pinselstrichen sowie organischen und geometrischen Formen ein. Der Fokus liegt auf der Mitte, wo das Gefühl am stärksten ist, während der Hintergrund verschwommen und verträumt wirkt. Hochauflösend, lebendig und regt zum Nachdenken an. – Abschnitt 4
Die Gestaltungsmöglichkeiten sind endlos. Sie müssen sich nicht den Kopf zerbrechen, um Anregungen zu finden. Wenn Sie im Erkundungsmodus sind, kann ChatGPT interessante Ideen liefern, die Sie jederzeit an Ihre Absichten anpassen können.
ChatGPT-Entwicklungsrichtung, Unterstützung der Erstellung im Textfeld
ChatGPT ist von Natur aus unvorhersehbar. Man weiß erst, was der Chatbot ausgibt, wenn er fertig ist. Und da er auch unzuverlässig ist (er ist nicht standardmäßig auf Wahrheit ausgelegt – er wird nur verstärkt), weiß man nicht, wann er etwas Verrücktes produziert.
Harvard-Doktorand Kareem Carr hat die Debatte in einigen Tweets positiv dargestellt. Ich stimme ihm zu:
In diesem Kontext bedeutet „Erforschung einer Idee“, dass sie nicht wahr sein muss (da sie möglicherweise nicht den Gesetzen unterliegt, die unsere Welt regieren) und unbegrenzt ist (d. h. alles kann passieren).
Einige Beispiele, wo ich ChatGPT gerne (noch) verwenden würde, sind das Brainstorming zu Artikelthemen, Titeln und sogar Gliederungen sowie das Empfehlen von Dingen, die in Kategorien fallen, deren Authentizität ich beurteilen kann (wie etwa eine Liste mit Geschenken im Wert von X Dollar oder eine Liste mit Büchern, die ich als nächstes lesen möchte (angesichts meiner jüngsten Vergangenheit).
Auch andere fanden ChatGPT hilfreich für kreative Inspiration. Der Cartoonist Chaz Sutton nutzt es, um lustige Comics zu erstellen, die er anschließend zeichnet (ein weiterer beliebter Beitrag auf Medium in diesem Monat). Guy Parsons, der sich auf Twitter mit KI-Kunstmodellen beschäftigt, schreibt damit Inhaltsangaben und Charakterbeschreibungen für Horrorfilme, die er dann in Midjourney einspeist. Jennifer Lepp, die ein E-Book für Kindle über das Subgenre „paranormaler Suspense“ schreibt, nutzt es für „Titel und Handlung“.
Eine weitere Frage ist, wo die Grenze zwischen richtig und falsch verläuft, wenn es darum geht, ChatGPT kreative Arbeit leisten zu lassen. Wenn es eine einprägsame Überschrift liefert, ist es in Ordnung, sie zu verwenden, aber einen Absatz zu schreiben, ist es nicht? Es liegt an jedem von uns, zu entscheiden, wie wir KI nutzen wollen – und ich werde dies sorgfältig und offenlegen (zumindest bis wir einen Punkt erreichen – falls überhaupt –, an dem ChatGPT standardmäßig in den Prozess eingebunden wird, wie Grammarly. Dann entscheide ich, ob ich es weiterhin nutzen möchte).
ChatGPT-Entwicklungsrichtung, weitere Erforschung von Sprachmodellen
Die Verwendung von ChatGPT zum Verständnis seiner Funktionsweise ist eine Schlüsselanwendung, die sich indirekt auf alle anderen Anwendungen auswirkt – obwohl ich zugeben muss, dass es für den durchschnittlichen Benutzer nicht so interessant ist.
So wie KI-Kunstmodelle nicht mit Kameras vergleichbar sind, ist ChatGPT nicht mit einem Taschenrechner vergleichbar. Ein Grund dafür ist die inhärente „Unerklärlichkeit“ großer Deep-Learning-Modelle. Es gibt kein Handbuch, das den Benutzern genau erklärt, was zu tun ist. Mit ChatGPT können wir Verhaltenseinblicke nur durch deduktive Empirie gewinnen (wir sehen uns Beispiele für sein Verhalten an und ziehen daraus Schlussfolgerungen).
Die Verwendung von ChatGPT zum Erlernen dieser Funktion ist an sich schon eine ziemlich einzigartige Anwendung – ich kenne kein anderes Verbraucherprodukt, das in diese Kategorie fällt (aus Notwendigkeit, nicht aus freien Stücken). Die Vorgehensweise besteht darin, eine Reihe von Experimenten durchzuführen, um die Fähigkeiten des Modells zu testen und ein mentales Modell zu entwickeln, wo es gut funktioniert und wo es nicht funktioniert (Gary Marcus und andere stellen Dokumentationen zu den Fehlern von ChatGPT zusammen).
Meine Tests waren nicht besonders gründlich, aber ich fand sie eine großartige Inspirationsquelle, um euch die Grenzen von LM aufzuzeigen. Ich habe einen Beitrag mit GPT-3 geschrieben und ihn erst am Ende offengelegt. Ich habe GPT-3 und J1-Jumbo die Ausgaben austauschen lassen, um zu sehen, wie sich die Diskussion ohne mein Eingreifen entwickeln würde. Und ich habe gemeinsam mit Lex einen Beitrag geschrieben, um die Unfähigkeit von LM hervorzuheben, Argumente zu liefern, die meinen entsprechen.
Soweit ich weiß, hat Riley Goodside in diesem Bereich mehr öffentliche Arbeit geleistet. Er hat GPT-3, ChatGPT und zuletzt Claude erforscht – vielleicht mehr als jeder andere außerhalb von OpenAI und Anthropic. Er war einer der ersten, der entdeckte, wie die Sicherheitsfilter von ChatGPT versagen könnten, und schlug rechtzeitige Injektionen vor, die zwar potenziell schädlich sind, Unternehmen mit Modellen aber Einblicke in die Behebung von Fehlern geben könnten, die sonst unbemerkt bleiben würden. Diese Art von Tests gehört zu den wenigen, die wir nutzen können, um die Vorgänge in generativen KI-Modellen besser zu verstehen.