Projekty Lokalne AI / Audio tooling / TUI

KeyNote

Narzędzie do notatek głosowych i testowania audio-to-text na lokalnych modelach multimodalnych. KeyNote łączy push-to-talk, tryby promptów, lokalny zapis w SQLite, eksport, workflow schowka i terminalowy UI wokół pętli transkrypcji przez llama-server.

Co robi

Projekt zaczął się jako sposób na testowanie lokalnych możliwości audio-to-text w modelach multimodalnych. Z czasem stał się małym systemem notatek: nagrania tworzą nowe wpisy, osobny skrót dopisuje do aktywnej notatki, treść można przeszukiwać, eksportować do Markdowna i przetwarzać przez wielokrotnego użytku tryby promptów.

Części systemu

Warstwa Rola Implementacja
Capture Push-to-talk i długie nagrania Globalne skróty, wybór urządzeń audio, mikrofon albo wejście loopback.
Processing Lokalna transkrypcja i tryby promptów Requesty do lokalnego llama-server, z trybami mail, Slack, transcript i summarize.
Storage Przeszukiwalne lokalne notatki SQLite, metadata, dopisywanie do aktywnej notatki i eksport do Markdowna.
Interface CLI, TUI i overlay pulpitu Komendy Click, ekrany Textual, automatyzacja schowka i mały overlay statusu/trybu.

Decyzje projektowe

  • Połączenie szybkiego push-to-talk z dłuższymi nagraniami, które wymagają chunkowanego przetwarzania.
  • Tryby promptów są edytowalne, ale nadal szybkie do przełączania skrótami.
  • Dane zostają lokalnie, a narzędzie korzysta ze schowka i aktywnego okna bez budowania usługi cloud.
  • Ten sam magazyn notatek działa z komend CLI i interaktywnego terminalowego UI.