T

info 8abaf39a3a feat(claude): bump-version Skill auf uv version --bump umgestellt

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>

2026-05-23 16:43:00 +02:00

.claude

feat(claude): bump-version Skill auf uv version --bump umgestellt

2026-05-23 16:43:00 +02:00

docs/superpowers

docs: Implementierungsplan für Mikrofon-Monitor

2026-05-14 17:29:57 +02:00

systemd

feat: add systemd user service unit

2026-04-06 20:30:09 +02:00

tests

fix(app): Recorder-Stop vor Ersatz + create_monitor in Tests mocken

2026-05-14 18:19:01 +02:00

whisper_local

fix(app): Recorder-Stop vor Ersatz + create_monitor in Tests mocken

2026-05-14 18:19:01 +02:00

.gitignore

chore: .gitignore um *.zip und build/ erweitern

2026-04-11 12:04:57 +02:00

build.ps1

feat: Windows-Packaging mit PyInstaller (ZIP ohne Python-Installation)

2026-04-11 12:01:02 +02:00

CLAUDE.md

docs: extend CLAUDE.md with language and uv run conventions

2026-04-10 20:24:04 +02:00

config.example.toml

docs: [media]-Abschnitt in config.example.toml

2026-04-15 19:04:25 +02:00

pyproject.toml

chore: bump version to 1.3.0

2026-05-14 18:47:25 +02:00

README.md

docs: update README with microphone monitoring and dependency changes

2026-05-14 19:13:26 +02:00

uv.lock

docs: update README with microphone monitoring and dependency changes

2026-05-14 19:13:26 +02:00

whisper_local.spec

feat: Windows-Packaging mit PyInstaller (ZIP ohne Python-Installation)

2026-04-11 12:01:02 +02:00

README.md

whisper-local

Lokales Speech-to-Text mit globalem Hotkey. Hotkey halten → Sprechen → loslassen → faster-whisper transkribiert lokal → Text wird ins aktive Textfeld eingefügt. Kein Netzwerk, kein Cloud-Service.

Läuft als Hintergrunddienst mit Tray-Icon auf Linux (KDE Plasma / Wayland) und Windows 10/11.

Features

Systemweiter Hotkey (Standard: F12), konfigurierbar über den Einstellungs-Dialog im Tray
Einfügen ins aktive Textfeld unabhängig von der Anwendung (Browser, Terminal, IDE …)
Mikrofon-Auswahl über Tray-Einstellungen
Mikrofon-Verbindungsüberwachung: automatischer Fallback auf Standard-Mikrofon wenn das konfigurierte Gerät getrennt wird, Toast-Benachrichtigung + Tray-Warnung
Lokale Transkription via faster-whisper
Tray-Icon mit drei Zuständen: warten / aufnehmen / transkribieren

Systemabhängigkeiten

Linux (Arch / CachyOS)

sudo pacman -S ydotool wl-clipboard libayatana-appindicator gobject-introspection

ydotool — simuliert Tastatureingaben unter Wayland (Text-Einfügen via Ctrl+V)
wl-clipboard — Clipboard-Zugriff unter Wayland (wl-copy)
libayatana-appindicator + gobject-introspection — Tray-Icon über StatusNotifierItem (KDE/Wayland)

Damit ydotool ohne sudo funktioniert, muss der ydotoold-Daemon laufen und der Benutzer in der input-Gruppe sein:

sudo systemctl enable --now ydotool
sudo usermod -aG input $USER
# Neu-Login nötig

Der Benutzer braucht außerdem Lesezugriff auf /dev/input/event*, was die input-Gruppen-Mitgliedschaft abdeckt.

Windows

Keine System-Dependencies. pynput und pywin32 werden automatisch via uv installiert.

Installation

Voraussetzung: uv (Python-Paketmanager).

git clone <repo-url> whisper-local
cd whisper-local
uv sync

uv sync installiert plattformspezifisch:

Linux: evdev, PyGObject, pystray, Pillow, sv-ttk, darkdetect, notify-py
Windows: pynput, pywin32, comtypes, pystray, Pillow, sv-ttk, darkdetect, notify-py

Konfiguration

Die Konfigurationsdatei wird beim ersten Start angelegt. Vorlage: config.example.toml.

Linux: ~/.config/whisper-local/config.toml
Windows: %APPDATA%\whisper-local\config.toml

Hotkey und Mikrofon lassen sich auch direkt über den Einstellungs-Dialog im Tray ändern (Rechtsklick aufs Tray-Symbol → „Einstellungen"). Änderungen greifen sofort ohne Neustart.

Key-Namen folgen dem evdev-Format (KEY_F12, KEY_LEFTSHIFT, …) — auch unter Windows.

Starten

uv run whisper-local

Beim ersten Start lädt faster-whisper das Whisper-Modell (Standard: small) herunter. Danach erscheint das Tray-Icon und der Hotkey ist aktiv.

Autostart unter Linux (systemd user unit)

mkdir -p ~/.config/systemd/user
cp systemd/whisper-local.service ~/.config/systemd/user/
systemctl --user daemon-reload
systemctl --user enable --now whisper-local.service

Das whisper-local-Executable muss dafür in ~/.local/bin verfügbar sein (uv tool install . oder Pfad in der Unit anpassen).

Entwicklung

uv run pytest                    # Tests
uv run python -m whisper_local   # Direkt starten

Plattform-spezifische Tests werden über @pytest.mark.skipif(sys.platform != ...) übersprungen.

Architektur- und Designdokumente liegen unter docs/superpowers/.

Lizenz

TBD

Releases 1

1.3.0 Latest

2026-05-14 19:31:35 +02:00

Languages

Python 97.6%

PowerShell 2.4%