KeyNote
Narzędzie do notatek głosowych i testowania audio-to-text na lokalnych modelach multimodalnych.
KeyNote łączy push-to-talk, tryby promptów, lokalny zapis w SQLite, eksport, workflow schowka
i terminalowy UI wokół pętli transkrypcji przez llama-server.
Co robi
Projekt zaczął się jako sposób na testowanie lokalnych możliwości audio-to-text w modelach multimodalnych. Z czasem stał się małym systemem notatek: nagrania tworzą nowe wpisy, osobny skrót dopisuje do aktywnej notatki, treść można przeszukiwać, eksportować do Markdowna i przetwarzać przez wielokrotnego użytku tryby promptów.
Części systemu
| Warstwa | Rola | Implementacja |
|---|---|---|
| Capture | Push-to-talk i długie nagrania | Globalne skróty, wybór urządzeń audio, mikrofon albo wejście loopback. |
| Processing | Lokalna transkrypcja i tryby promptów | Requesty do lokalnego llama-server, z trybami mail, Slack, transcript i summarize. |
| Storage | Przeszukiwalne lokalne notatki | SQLite, metadata, dopisywanie do aktywnej notatki i eksport do Markdowna. |
| Interface | CLI, TUI i overlay pulpitu | Komendy Click, ekrany Textual, automatyzacja schowka i mały overlay statusu/trybu. |
Decyzje projektowe
- Połączenie szybkiego push-to-talk z dłuższymi nagraniami, które wymagają chunkowanego przetwarzania.
- Tryby promptów są edytowalne, ale nadal szybkie do przełączania skrótami.
- Dane zostają lokalnie, a narzędzie korzysta ze schowka i aktywnego okna bez budowania usługi cloud.
- Ten sam magazyn notatek działa z komend CLI i interaktywnego terminalowego UI.