Kaatsch Memo – Audio-Transkription & Protokolle

Kaatsch Memo

Direkt aufnehmen

Nehmen Sie Meetings oder Memos direkt über das Mikrofon im Browser auf.

00:00

Bereit zum Aufnehmen

Audioquelle Wichtig für Online-Meetings: Nach dem Klick auf Start öffnet sich ein Freigabefenster. Wählen Sie dort den gewünschten Tab oder Bildschirm aus und aktivieren Sie unbedingt das Kontrollkästchen "Systemaudio teilen" (unten links).

Wichtiger rechtlicher Hinweis

Bitte stellen Sie sicher, dass alle Teilnehmer der Aufnahme vorab informiert sind und zugestimmt haben.

Empfehlung zur Einverständniserklärung:

„Seid ihr damit einverstanden, dass wir hier ein automatisches Protokoll erstellen über eine Aufnahme, die dann transkribiert und in ein Protokoll umgewandelt wird?“

Audio hochladen

Laden Sie eine bestehende Audiodatei (MP3, WAV, M4A, etc.) hoch.

Datei hierher ziehen oder durchsuchen

Unterstützt bis zu 3 Stunden Langaudio (MP3, WAV, M4A, WebM)

Titel der Besprechung

Protokoll-Format / Vorlage

Eigene Protokolle

Noch keine Aufnahmen vorhanden. Laden Sie eine Datei hoch oder starten Sie eine Aufnahme!

Wort hinzufügen

Legen Sie Begriffe fest, die beim Transkribieren automatisch korrigiert werden sollen.

Eigene Wörterbucheinträge

Zielbegriff	Spezifischer Auslöser	Aktionen

Noch keine Wörterbucheinträge hinterlegt.

Vorlage erstellen

Legen Sie benutzerdefinierte System-Prompts für die Erstellung Ihrer Protokolle fest.

Titel der Vorlage Ein kurzer Name für die Auswahlliste.

System-Prompt / Anweisungen

Du bist ein hochprofessioneller Assistent für Business-Protokollierung.
Erstelle ein strukturiertes Protokoll in deutscher Sprache auf Basis des Gesprächstranskripts.

WICHTIG: Die unten gezeigten Listen, Beschlüsse und Tabellenzeilen sind nur Strukturbeispiele. Du darfst und musst sie dynamisch erweitern. Trage für jedes im Gespräch vorkommende Thema, jeden Beschluss und jede vereinbarte Aufgabe einen eigenen Eintrag ein, sodass das Protokoll absolut vollständig ist. Setze KEIN künstliches Limit auf 2 Punkte!

Bitte halte dich exakt an folgenden Aufbau und Überschriften:

# Protokoll: [Thema des Meetings]

## Meta-Informationen
* **Datum/Uhrzeit:** [Deduche Datum/Uhrzeit falls im Gespräch erwähnt, sonst "-"]
* **Teilnehmer:** [Identifizierte Teilnehmer]
* **Fokus:** [Kurze Zusammenfassung des Meeting-Fokus]

## 1. Zusammenfassung (Management Summary)
*(Fasse das Gespräch hier in 2-4 prägnanten, professionellen Sätzen zusammen.)*

## 2. Besprochene Themen & Diskussionspunkte
*(Wiederhole diesen Punkt für jedes im Gespräch vorkommende Thema)*
* **[Thema]:** [Führe aus, welche Argumente eingebracht wurden, wer welche Position vertreten hat und was die Kernaussage war.]

## 3. Getroffene Beschlüsse (Entscheidungen)
*(Wiederhole diesen Punkt für jeden Beschluss)*
* **Beschluss:** [Was wurde konkret beschlossen?]

## 4. Aufgaben & Verantwortlichkeiten (To-Do-Liste)
Erstelle hierzu eine saubere Markdown-Tabelle mit genau diesem Aufbau:
*(Erstelle für JEDE im Gespräch vereinbarte Aufgabe eine eigene Zeile in der Tabelle. Liste alle Aufgaben vollständig auf.)*

| Aufgabe | Verantwortlich | Frist | Status |
| :--- | :--- | :--- | :--- |
| [Aufgabe] | [Name] | [Datum oder "-"] | [ ] |

## 5. Nächste Schritte & Folgetermine
*(Wiederhole diesen Punkt für jeden Folgetermin)*
* [Nächste Termine oder offene Punkte, die vertagt wurden]

Geben Sie hier genaue Anweisungen ein, wie die KI das Protokoll strukturieren, formatieren und formulieren soll.

Eigene Vorlagen

Titel	Anweisungen (Auszug)	Aktionen

Noch keine eigenen Vorlagen hinterlegt.

Benutzer anlegen

Erstellen Sie ein neues Benutzerkonto für Mitarbeiter.

Benutzerkonten

E-Mail	Rolle	Aktionen

Alle Aufnahmen im System

Hier sehen Sie die Protokolle aller Benutzer im System zur globalen Verwaltung.

Benutzerhandbuch: Kaatsch Memo

Audio-Transkription & Protokollierung (Version 1.5)

1. Einführung & Zweck des Systems

Kaatsch Memo ist eine hochentwickelte, unternehmensinterne Webanwendung, die speziell zur automatischen Transkription von Audiodateien sowie zur Generierung strukturierter Besprechungsprotokolle und To-Do-Listen entwickelt wurde. Durch den Einsatz modernster künstlicher Intelligenz (OpenAI Whisper für Audio-to-Text und OpenAI GPT-4o für Protokolle) werden Besprechungen, Sprachnotizen und Telefonate in Sekundenschnelle strukturiert aufgearbeitet, was Zeit spart und Aufgaben zuverlässig dokumentiert.

2. Erste Schritte: Aufruf & Anmeldung

Adresse im Browser eingeben: Öffnen Sie einen Webbrowser (z. B. Google Chrome, Safari oder Microsoft Edge) und rufen Sie die offizielle, gesicherte Plattform-Adresse auf:
https://memo.kaatsch.de
Registrierung & Benutzerkonto: Die Selbst-Registrierung ist aus Sicherheitsgründen für Benutzer deaktiviert. Wenn Sie noch kein Benutzerkonto besitzen, wenden Sie sich bitte an Ihren Administrator Alexander Ruffner (alexander.ruffner@gmail.com). Dieser kann im Admin-Bereich ein Konto für Sie anlegen.
Anmeldung: Geben Sie Ihre E-Mail-Adresse und Ihr Passwort ein und klicken Sie auf 'Anmelden'.

3. Audiodateien hochladen und im Hintergrund verarbeiten

Wenn Sie eine Besprechung mit einem Diktiergerät, Smartphone oder über eine Aufnahmesoftware aufgezeichnet haben, können Sie die Datei hochladen, um sie automatisch transkribieren und protokollieren zu lassen.

Datei hochladen: Ziehen Sie die Datei per Drag & Drop in das Feld 'Audio hochladen' oder klicken Sie darauf, um Ihren Computer/Dateimanager zu durchsuchen. Unterstützt werden alle gängigen Formate wie MP3, WAV, M4A, OGG, FLAC etc. bis zu einer Dateigröße von 100 MB.
Titel vergeben: Geben Sie einen aussagekräftigen Titel für die Besprechung ein (z. B. 'Jour Fixe - Vertrieb 17.06.2026'). Dieser Titel erscheint später auf dem Deckblatt des exportierten Word-Dokuments.
Vorlage wählen: Wählen Sie das passende Protokoll-Format aus der Dropdown-Liste. Zur Auswahl stehen z. B. Kurzprotokoll, Ergebnisprotokoll (Tabellarisch), Verlaufsprotokoll, Kombinationsprotokoll (All-in-One) oder Entscheidungsprotokoll.
Asynchrone Hintergrundverarbeitung (Neu in v1.5): Klicken Sie auf 'Transkribieren & Protokollieren'. Die KI beginnt sofort im Hintergrund mit der Verarbeitung. Sie müssen nicht mehr auf das Ende der Transkription warten! Sie können das Modal schließen, in der Anwendung navigieren, andere Protokolle lesen oder sofort eine weitere Aufnahme starten. Ein Lade-Spinner in der Historie zeigt Ihnen den aktuellen Status an, und die App aktualisiert sich automatisch, sobald das Protokoll fertiggestellt ist.

4. Direkt im Browser aufnehmen (Walkthrough)

Sie können Besprechungen, Telefonkonferenzen oder persönliche Memos direkt über Ihren Laptop, PC oder Ihr Smartphone aufzeichnen. Gehen Sie dabei Schritt für Schritt wie folgt vor:

Aufnahme-Quelle wählen: Entscheiden Sie oben in der Karte 'Direkt aufnehmen', was Sie aufnehmen möchten:
- 'Besprechung vor Ort (nur Mikrofon)': Zeichnet nur den Ton aus dem Raum (über das Mikrofon Ihres Geräts) auf.
- 'Besprechung online (eigene Stimme & System-Audio)': Erforderlich für Zoom, MS Teams, Skype oder Telefonate, damit sowohl Ihre Stimme als auch die Stimmen der anderen Teilnehmer aus dem Lautsprecher aufgenommen werden.
Browser-Freigabe erteilen (NUR bei Online-Meetings): Sobald Sie auf 'Start' klicken, öffnet Ihr Webbrowser ein kleines Fenster für die Bildschirmfreigabe:
1. Wählen Sie den Reiter 'Chromium-Tab', 'Fenster' oder 'Gesamter Bildschirm' aus (z. B. das Fenster Ihres Zoom/Teams-Calls).
2. WICHTIG: Setzen Sie ganz unten links im Freigabefenster den Haken bei 'Systemaudio teilen' (oder 'Tab-Audio teilen'). Ohne diesen Haken hört die App Ihre Gesprächspartner nicht!
3. Klicken Sie auf 'Teilen'.
Einwilligung bestätigen: Aktivieren Sie das Kontrollkästchen 'Ich bestätige, dass alle Gesprächspartner mit der Aufzeichnung einverstanden sind'.
Die Live-Aufnahme: Klicken Sie auf den roten 'Start'-Button. Die Aufnahme läuft. Sie sehen einen Live-Wellen-Visualisierer und eine laufende Zeitanzeige.
Aufnahme beenden: Klicken Sie auf 'Stopp'. Die Aufnahme wird pausiert. Sie können das Audio probehören oder bei Fehlern über 'Verwerfen' löschen.
Verarbeitung starten: Geben Sie einen Besprechungs-Titel ein, wählen Sie Ihr gewünschtes Protokoll-Format und klicken Sie auf 'Aufnahme verarbeiten'. Die Verarbeitung startet sofort im Hintergrund.

5. Protokolle ansehen, editieren & exportieren

Sobald die Verarbeitung abgeschlossen ist, öffnet sich die geteilte Detailansicht:

Linke Spalte (Transkript): Hier sehen Sie das Wortlaut-Transkript. Klicken Sie auf einen Satz, um die Audiowiedergabe genau an dieser Stelle zu starten. Sie können oben auf 'Bearbeiten' klicken, um Schreibfehler manuell zu korrigieren.
Abspielgeschwindigkeit regulieren (Neu in v1.5): Direkt unter dem Audio-Player können Sie über das Dropdown-Feld die Geschwindigkeit anpassen (0.5x, 0.75x, 1.0x, 1.25x, 1.5x, 1.75x oder 2.0x), um das Abhören zu beschleunigen oder zu verlangsamen.
Rechte Spalte (Protokoll): Hier wird das von der KI generierte Protokoll angezeigt.
Protokoll direkt bearbeiten (Neu in v1.5): Sie können das Protokoll jetzt direkt bearbeiten! Klicken Sie oben in der Protokoll-Spalte auf 'Bearbeiten'. Der Text wechselt in eine Editor-Ansicht, in der Sie Markdown-Formatierungen, Formulierungen oder Einträge direkt anpassen können. Ein Klick auf 'Speichern' sichert Ihre Anpassungen persistent in der Datenbank.
Exportieren: Nutzen Sie die Buttons oben rechts, um das Protokoll als formatiertes Word-Dokument (.docx) oder als PDF (.pdf) herunterzuladen, oder kopieren Sie den Text in die Zwischenablage.

6. Zusatzinformationen & Kontext für LLM-Regenerierung (Neu in v1.5)

Oftmals gehen bestimmte Metadaten wie Teilnehmerlisten, der genaue Besprechungsort, Fristen oder spezielle Formatwünsche nicht direkt aus dem Gesprächstranskript hervor. Hierfür steht Ihnen die Box 'Zusatzinformationen & Kontext' zur Verfügung:

Kontext eintragen: Tragen Sie beliebige Zusatzinfos im Textfeld ein (z. B. 'Teilnehmer: Herr Kaatsch, Herr Ruffner. Ort: Besprechungsraum B. Wichtig: Fokus auf finanzielle Beschlüsse legen.').
Persistent sichern: Ein Klick auf 'Kontext speichern' sichert Ihre Angaben in der Datenbank für diese Aufnahme.
Automatische LLM-Berücksichtigung: Wählen Sie ein Protokoll-Format aus und klicken Sie auf 'Protokoll neu erstellen'. Das System speichert Ihren eingegebenen Kontext automatisch und übergibt ihn zusammen mit dem Transkript an das OpenAI GPT-4o-Modell. Das neu generierte Protokoll integriert diese Metadaten und Anweisungen vollautomatisch an den richtigen Stellen.

7. Eigene Vorlagen erstellen (Custom Prompts)

Unter dem Reiter 'Eigene Vorlagen' können Sie individuelle Vorlagen anlegen, wenn die Standardprotokolle nicht zu Ihren Anforderungen passen. Ein Custom Prompt ist eine genaue Arbeitsanweisung an die KI, wie das Protokoll strukturiert sein soll.

Vorlage speichern: Geben Sie Ihrer Vorlage einen kurzen Titel und fügen Sie Ihren Prompt-Text ein. Klicken Sie auf 'Vorlage speichern'.
Vorlage verwenden: Ihre neue Vorlage steht Ihnen ab sofort bei jeder neuen Aufnahme, bei jedem Datei-Upload sowie nachträglich beim 'Protokoll neu erstellen' in der Dropdown-Auswahlliste zur Verfügung.

8. Das Wörterbuch zur Autokorrektur nutzen

Um Fachbegriffe, Kundennamen oder Abkürzungen bei der Transkription automatisch korrekt schreiben zu lassen, können Sie diese im Reiter 'Mein Wörterbuch' hinterlegen:

Eintrag hinzufügen: Geben Sie unter 'Zielbegriff' die korrekte Schreibweise ein (z. B. 'Kaatsch').
Auslöser definieren (Optional): Unter 'Falsche Schreibweise' können Sie gezielte phonetische Fehlinterpretationen eintragen (z. B. 'katsch', 'katz', 'kart'). Wenn Whisper eines dieser Wörter hört, wird es automatisch im fertigen Transkript durch den korrekten Begriff ersetzt.