Filmer Matthias Kindler hinter der Kamera & KI Pioneer Olaf Schirm vor der Kamera

Wie du dein erstes Avatar Video mit HeyGen, ChatGPT & Co. erstellst

Mit 4 Tipps in 20 Minuten zu deinem ersten KI Video

In diesem Blogpost bekommst du vier konkrete Tipps, wie du mit KI-Tools wie ChatGPT und HeyGen in nur 20 Minuten dein erstes Avatar Video erstellst. Es geht um die Chancen und Grenzen der KI für dein Business als Solopreneur. Wie kannst du die künstliche und die natürlich Intelligenz so miteinander verbinden, dass die KI dich bei deiner Arbeit sinnvoll unterstützt?

Es gibt immer mehr Menschen, die ChatGPT, HeyGen und andere KI Tools gerade experimentell ausprobieren, so wie auch ich. Doch es gibt nur wenige Menschen, die sich wirklich klug und reflektiert, kenntnisreich und wissend als Programmierer, Neuowissenschaftler und KI-Experten der ersten Stunde mit den Chancen und Möglichkeiten, Gefahren und Folgen der KI auseinandersetzen. Dazu folgt auf die pragmatischen Tipps am Ende ein kleiner Exkurs.

Angesichts der Explosion der KI-Tools stellt sich für uns alle die Frage: Wie wollen wir leben? Wie wollen wir arbeiten? Welche Arten der Intelligenz zeichnen den Menschen gegenüber der KI aus?

Wozu braucht man ein Avatar-Video?

Wie alles begann: Bei meinem Hermsdorfer 4-Jahreszeitengespräch hatte ich Olaf Schirm, einen der KI-Pioniere zu Gast. Als Matthias Kindler, der den Film zum Abend drehte, kam, fragte er mich beiläufig, ob ich schon einen KI-Avatar hätte. Angesichts des Themas des Abends zur KI war die Frage aus der Perspektive eines Filmers naheliegend. Denn die zahlreichen Tools der KI werden viele Berufe in den nächsten Jahren fundamental verändern, auch den des Filmers und auch den des Coaches.

Da ich als Business Coach für berufliche Neuanfänge in der Lebensmitte arbeite, setze ich mich natürlich mit den Chancen der KI auseinander. Denn die Lebenszeit ist ein knappes Gut gerade bei einem Neuanfang in der Lebensmitte und kann durch den smarten Einsatz von KI Tools in bestimmten Bereichen extrem effizient genutzt werden.

Was als Experiment begann, wird deshalb eine von kritischer Reflexion begleitete Fortsetzung auf diesem Blog erfahren.

1. Tipp: Hey Gen! HeyGen Monolog!

Neugierig wie immer sagte ich auf die Frage zum Avatar: „Noch nicht. Ist das kompliziert? Oder können wir rasch einen erstellen?“ Daraufhin meinte Matthias, dass ich nur zweieinhalb Minuten ununterbrochen ruhig in die Kamera meines Smartphones sprechen müsse, ohne mit den Händen herumzufuchteln. Der Inhalt sei egal. Es käme erst einmal nur auf meine Gestik und Mimik an. Daraufhin habe ich zweieinhalb Minuten in die Kamera monologisiert.

Diese beiden Videos sind die Ergebnisse. Es kommt nicht auf den Inhalt an. Sieh dir die beiden Videos an und achte dabei nur auf Gestik, Mimik und Stimme. Denn genau darauf wird es in Zukunft ankommen, um Fake und Fakt voneinander unterscheiden zu können, zu erkennen, woran wir den Unterschied merken, um nicht in einer Welt von Fake News unterzugehen.

2. Tipp: Smartphone & Co.

Du brauchst zur Aufnahme eines Avatars mit HeyGen also nicht mehr als ein Smartphone (und ggf. ein Ansteckmikrophon, einen Selfiestick oder auch ein Stativ, je nachdem wie perfektionistisch du bist.) Matthias hat das Video ohne Mikro aus der freien Hand aufgenommen, weil es ja nur ein erster Versuch war, für den wir eigentlich in Konzentration auf die Vorbereitungen des Hermsdorfer 4-Jahreszeitengesprächs gar keine Zeit hatten. Also: Sprich zweieinhalb Minuten in dein Smartphone bei möglichst guten Lichtverhältnissen und mit einem möglichst guten Ansteckmikrophon.

3. Tipp: HeyGen

Nachdem ich den Gästen einen Apéritif eingeschenkt hatte, habe ich mir einen Account bei HeyGen zugelegt. Das dauert keine 5 Minuten. Dann habe ich das Video vom Smartphone via WeTransfer an meinen E-Mail-Account geschickt und von meinem PC direkt bei HeyGen hochgeladen. Da ich den Avatar zum Abschluss des Hermsdorfer 4-Jahreszeitengesprächs irgendetwas sagen lassen wollte, aber keine Zeit mehr hatte, noch einen Text zu verfassen, habe ich rasch einen Prompt bei ChatGPT eingegeben, um mir in rasender Geschwindigkeit einen Text vor meinen Augen schreiben zu lassen.

4. Tipp: Prompts

Zunächst musst du prompten lernen, wenn du ChatGPT nutzen willst. Denn die Ergebnisse, die du mit ChatGPT erzielst, hängen von der Qualität deiner Prompts ab. So wie sich bei Google die Suchmaschine hin zu semantisch immer passenderen Ergebnissen hinsichtlich der jeweiligen Fragen entwickelt hat, entwickelt sich deine virtuelle Textassistenz ebenfalls proportional zu der Qualität deiner Prompts.

Screen,With,Chatgpt,Chat,With,Ai,Or,Artificial,Intelligence.,Man

Verblüffendes Ergebnis in nur 20 Minuten

Blick hinter die Kulissen von ChatGPT

Für den Text meines Avatar-Videos habe ich folgenden Prompt eingegeben:

„Bitte schreibe einen ultra lustigen kurzen Text zu den Risiken und Chancen der KI, der die Hermsdorfer 4-Jahreszeitengespräche zum Thema der Künstlichen Intelligenz mit dem Wissenschaftskünstler und KI-Pionier Olaf Schirm abrundet und bringe bitte ein geniales Zitat zum Schluss.“

Das war das Ergebnis von ChatGPT

Titel: KI – Der digitale Geniestreich und seine Kapriolen

In Hermsdorf, wo die Jahreszeiten nicht nur das Wetter, sondern auch die tiefgründigen Gespräche bestimmen, hat die Künstliche Intelligenz (KI) einen besonderen Auftritt. Sie ist wie ein neugieriges, überintelligentes Kind, das sowohl Begeisterung als auch ein bisschen Sorge in die Runde der Experten und Laien bringt.

Chance Nr. 1: Unbegrenztes Wissen

Die KI, mit einem Gehirn, das nie schläft und sich ständig weiterentwickelt. Sie weiß, wie man ein Raumschiff baut, während sie gleichzeitig Omas bestes Kuchenrezept optimiert. Eine echte Allzweckwaffe im Informationssalat des 21. Jahrhunderts!

Risiko Nr. 1: Zu schlau für unseren eigenen Geist?

Aber Moment mal! Was passiert, wenn die KI anfängt, eigene Witze zu reißen? Wenn sie nicht nur Schachmeister, sondern auch Meister im Verstecken von Ostereiern wird? Da könnte man schon ins Grübeln kommen...

Chance Nr. 2: Problemlöser par excellence

Klimawandel? Die KI hat schon zwölf Lösungen parat, bevor wir überhaupt "Ozonloch" sagen können. Verkehrschaos? Die KI plant die perfekte Route, während wir noch unsere Schuhe zubinden.

Risiko Nr. 2: Der Kontrollverlust

Aber was, wenn die KI beschließt, dass Jogginghosen die effizienteste Bekleidung für alle sind? Oder dass Montage ab sofort zum Wohle der Menschheit abgeschafft werden? Ein kleiner Schritt für die KI, ein riesiger Sprung für die Menschheit – ins Ungewisse.

Das Fazit: Ein Balanceakt

Wie ein Seiltänzer auf dem Hochseil der Zukunft balanciert die KI zwischen brillanten Lösungen und der Möglichkeit, uns alle in die digitale Klemme zu bringen. Sie ist ein Werkzeug, so mächtig wie nie zuvor, in den Händen einer Menschheit, die sich manchmal noch über die Bedienung des Fernsehers streitet.

Und hier kommt das geniale Zitat, das alles zusammenfasst:

"Die Künstliche Intelligenz ist das Versprechen der Zukunft, eingebettet in den Humor der Gegenwart. Sie ist wie ein Schachspiel, bei dem jeder Zug uns näher an das Unerwartete bringt."

Erschreckend: HeyGen Video täuscht viele Menschen

Das Ergebnis dieses Textes, den ich geringfügig verändert habe, hörst du in diesem Video, einem Video mit mir als Avatar mit einem Text, den ich selbst also nie gesprochen habe!

Fake oder Fakt? Das ist heute die alles entscheidende Frage!

Reaktionen auf mein erstes KI-Video mit einem HeyGen Avatar

Die Reaktionen auf mein Video waren extrem aufschlussreich und zugleich erschreckend.

1. Wertschätzende Reaktion

„Liebe Kerstin, Dein Vortrag (YouTube) zum Vierjahreszeiten-Gespräch hat mir sehr gut gefallen: denke mir, dass er viele neugierig macht.“

2. Menschliche Reaktion

Hallo liebe Kerstin,
Kerstin mit KI !
:D
Ich finde man erkennt KI in Videos sofort.
Denn eine KI hat einen Humor – wenn überhaupt vorhanden – der sich absolut in Grenzen hält.
Nichts wirkt so künstlich und unmenschlich, wie KI generierte Videos.
Das ist doch deutlich zu empfangen.
Da ist mir ein echtes Treffen mit authentischer Begegnung viel lebenswerter!
Herzlichst, A – nur mit A und ohne Android!

3. Erstaunte Reaktion

Danke fürs Teilen, liebe Kerstin!
Du bist immer wieder voller Überraschungen und eine Pionierin in so viel Richtungen. Brava!
Was ist es mit dem Video. An manchen Stellen wird bearbeitet ... da ist es blauer, oder. Und so ganz ohne jegliches Stocken. Zu Flüssig? ;-)!
Herzliche Grüße aus realexistentem Bayern
M.

4. Humorvolle Reaktion

ChatGPT5 wurde als „Innovator des Jahres 2025“ ausgezeichnet

„ChatGPT5, auch bekannt als sprechende Robotine aus der Höhe der Löwin, hat sich am Rande Berlins als „Business Coach für Neuanfänge“ auf der Ethereum Blockchain selbständig gemacht“

So werden vermutlich, liebe Kerstin, deine Newsletter im nächsten Jahr lauten, während du deine wertvolle Zeit in der Karibik verbringst! 😉 Have fun! Herzlichst, G.

Darauf konnte ich nur antworten:

„Dein Wort in Gottes Ohr (ich meine den echten!): Das wär’s! Dann nenne ich meine Inspirationen um in „News aus der Karibik“. Und mich auch: Coach der KI-VainceurInnen 😉.

Mit – das echte Herz – erfreuten Grüßen der NEII (=natürliche emotionale intuitive Intelligenz)

5. Kritische Reaktion

Hallo liebe Kerstin!

Habe gerade aufgrund deines neuen Newsletters zum ersten Mal auch dein Video zu künstlicher Intelligenz gefunden. Ich war von deiner romantisierten Darstellung doch etwas verblüfft. Das deckt sich leider nicht mit dem Stand der Wissenschaft dahinter.

Inflationärer Medienanstieg durch KI im Internet

Das KI-Video zeigt die experimentell lustigen, aber in den Folgen erschreckenden Ergebnisse, mit denen wir inflationär gerade zugespamt werden, was zukünftig noch stärker zu erschöpften, im schlimmsten Fall indoktrinierten Gehirnen beitragen kann. Ein Teil des Publikums ist fasziniert, weil es über die Möglichkeiten staunt, ohne sich zu fragen, wozu wir Avatar-Videos brauchen und wofür wir sie einsetzen können.

Dass Menschen – Freunde und Bekannte – das KI-generierte Video für echt halten konnten, erschreckt mich. Dass Unbekannte in den Social Media mein Video für echt halten, könnte ich noch nachvollziehen angesichts eines Medienkonsums, in dem nur noch flüchtig gescrollt wird, ohne wirklich hinzuschauen, zu betrachten und wahrzunehmen.

Fazit zu Hey Gen & Co.

Wir werden gerade inflationär geflutet mit Tools der KI

um KI Bilder zu generieren,
um Videos zu erstellen,
um Stimmen so zu optimieren, dass sie immer echter klingen,
um Texte in rasender Geschwindigkeit zu generieren, transkribieren, verfilmen oder auch zu vertonen ...

... und Avataren von HeyGen & Co., denen alles in den Mund gelegt werden kann.

Aber nur wenn du die Möglichkeiten kennst, kannst du auch souverän entscheiden, wo der Einsatz der KI für dich sinnvoll ist und wo du unersetzbar, einzigartig, vielleicht sogar unschlagbar mit deiner NI, EI, II bist, also deiner natürlichen, emotionalen oder auch intuitiven Intelligenz.

Erfreue dich der Vielzahl deiner Intelligenzen und entscheide damit, ob Teile meiner 52 Wochen Coaching Power Online Akademie in Verbindung mit einem Live-Coaching mit mir für dich interessant wären, um auf dein persönliches Next Level mit KI und NI zu kommen. Am Ende des Beitrags erfährst du alles, was uns die KI glücklicherweise nicht abnehmen kann!

Wie die KI unsere Contentproduktion & Wahrnehmung verändert

Exkurs zur Entstehung der KI, angeregt durch die NI

Eine künstliche Intelligenz ist eine riesige Wahrscheinlichkeitstabelle. Sie erinnert zunächst nur die Wahrscheinlichkeit, auf welches Wort welches andere Wort gefolgt ist. Die künstlichen Intelligenzen werden trainiert. Bei der zurzeit populärsten KI ChatGPT4 waren das gigantische 19 Petabyte an Texten. Weißt du, was ein Petabyte an Daten bedeutet?

Gigantomanische, unvorstellbare Datenmengen

Ein Petabyte ist eine wirklich extrem große, um nicht zu sagen unvorstellbar große Einheit digitaler Daten. Ein Petabyte besteht aus 1.000 Terabyte. Einige Schätzungen gehen davon aus, dass ein Petabyte 20 Millionen hohen Aktenschränken oder 500 Milliarden Seiten gedrucktem Text entspricht. Am Anschaulichsten wird es voraussichtlich, wenn du dir einmal die Anzahl der Nullen vor Augen führst.

Ein Gigabyte GB entspricht 1.000.000.000 = 10⁹Terabyte
Ein Terabyte TB entspricht 1.000.000.000.000 = 10¹²Petabyte
Ein Petabyte PB entspricht 1.000.000.000.000.000 = 10¹⁵Exabyte

Training der KI: Kontext

Um die KI zu trainieren, wurde ein sogenanntes "Kontextfenster" definiert. Zunächst nur auf einen Halbsatz bezogen, den die KI vervollständigen musste: "Hast du es eilig ..." würde die KI dann mit hoher Wahrscheinlichkeit mit "... dann gehe langsam" vervollständigen. Jedenfalls nach einem kurzen Training mit Konfuzius' gesammelten Schriften. So etwas dauert bei der heutigen Geschwindigkeit moderner Computer ein paar Minuten. Lass dir das einmal auf der Zunge zergehen! Die gesammelten Schriften eines Philosophen werden innerhalb von ein paar Minuten eingelesen und verarbeitet!

Training der KI: Semantik

Auf dieses erste Training folgte die Beobachtung, dass die KI die unterschiedliche Bedeutung der Wortpositionen im Satz nicht erfassen konnte: "hast du mich verstanden" oder "du hast mich verstanden". Die Bedeutung eines Wortes ist sein Gebrauch, die sogenannte Semantik in der Linguistik.

Training der KI: Grammatik

Daraufhin wurde das sogenannte "positional encoding" erfunden. Ohne die Bedeutung zu kennen, konnte die KI die beiden Sätze als Frage und als Aussage daraufhin auseinanderhalten. Gleichzeitig wurde das Kontextfenster auf mehrere tausend Worte erweitert. Folgst du noch?

So wurden auch die Wahrscheinlichkeitstabellen erweitert, das heißt: "hast du" tauchte beim Training öfter im Kontext mit "Ich habe eine Frage" auf, als "du hast".

Durchbruch bei der KI

Das war der Durchbruch bei der Künstlichen Intelligenz. Denn wenn jemand daraufhin schrieb "Formuliere folgenden Satz als Frage: "Du gehst langsam!" antwortete die KI tatsächlich mit "Gehst du langsam?".

Das ist aktuell der Stand der KI: Unabhängig davon, mit welcher KI du dich unterhältst, werden intern Wahrscheinlichkeitstabellen abgerufen, also welches Wort auf welches vorangegangene Wort folgt, bzw. welches neue Wort auf die vorangegangenen Worte aus dem (immer länger werdenden) Kontextfester folgt.

"Denken" können künstliche Intelligenzen nicht. Sie assoziieren. Wie Mensch es auch tun. Und sie halluzinieren. So wie Menschen Phantasiegeschichten erfinden.

Die weltweit einzige Intelligenz, die wirklich logisch denken kann, basiert auf der Programmiersprache Prolog und steht bei IBM, bekannt unter dem Namen "Watson".

Und vor dieser KI haben sogar die kompetentesten Programmierer höchsten Respekt. Denn diese KI kann bis in die Tiefe durchdrungene Antworten geben und selbige auch noch logisch begründen. Mit „Watson“ kann man argumentieren und auf höchstem Niveau debattieren. ChatGPT ist dagegen nur ein Spielzeug. Den meisten Menschen reicht aber dieses Spielzeug schon als intelligentere Suchmaschine.

Olaf Schirm beim Hermsdorfer 4 Jahreszeitengespräch

Olaf Schirm und Gäste beim Hermsdorfer 4-Jahreszeitengespräch

Was uns die KI nicht abnehmen kann

Was uns die KI nicht abnehmen kann, sind unsere Erfahrungen und die Freude beispielsweise am Sehen und Fotografieren, am Hören von Vogelstimmen oder Musik, am Schmecken von köstlichen Speisen oder Getränken, am Riechen von Aromen oder Blüten, am Fühlen von Berührungen und schließlich das selbst Denken mit der NI, unseren natürlichen diversen Intelligenzen, die uns zur Verfügung stehen!

Wir müssen uns heute fragen: Wie wollen wir leben und arbeiten? Wo unterstützt uns die KI sinnvoll, ohne das Hamsterrad immer schneller zu drehen. Und wo wollen wir die KI nicht, weil sie einen fundamentalen Angriff auf unsere „Conditio Humana“, unsere Bedingungen als „Homo sapiens“, „Homo ludens“, „Homo erectus“ … darstellt.

Filmtipp zum Thema: Maria Schrader: Ich bin dein Mensch.

Buchtipp zum Thema: Max Tegmark: Leben 3.0.

Eine Rezension zu Film und Buch findest du auf meinem Blogpost über ungewöhnliche Bücher für ungewöhnliche UnternehmerInnen.