Starter Story

Для решения задачи effortless-фиксации мыслей используется автоматическая транскрибация голосовых заметок через OpenAI и интеграция текста в Obsidian с помощью скрипта на Mac Mini

Транскрибированный текст автоматически появляется в Obsidian с правильным форматированием и временной меткой, а исходный аудиофайл удаляется.

Источник: FOS 12 // Intention OS: как CEO ManyChat Майк Ян строит систему осознанности

Связка 1

Начальное состояние: Голосовая заметка записана на Apple Watch с помощью встроенного приложения Voice Memos.
Преобразование: Заметка синхронизируется через iCloud на Mac Mini, где скрипт автоматически обнаруживает файл, отправляет его в OpenAI для транскрибации, а затем вставляет полученный текст в текущую дневниковую запись в Obsidian.
Конечное состояние: Транскрибированный текст автоматически появляется в Obsidian с правильным форматированием и временной меткой, а исходный аудиофайл удаляется.


OneSec — это один из примеров. Мы с тобой уже обсуждали Obsidian, искусственный интеллект и всю эту систему. Там история немного шире.

Дело в том, что в течение дня, помимо обычного дневника в календаре, я периодически записываю голосовые заметки на часах — буквально в два нажатия. У меня прямо в сборке на Apple Watch лежат встроенные Voice Memos из iOS. Нажимаешь одну кнопку, затем большую красную — и начинается запись.

Эти голосовые заметки синхронизируются через iCloud с моим аккаунтом. Дома у меня стоит Mac Mini, работающий в роли сервера, который подключён к тому же iCloud. В какой-то момент после синхронизации файлы появляются на нём локально.

На этом Mac Mini я настроил скрипт, который по сути следит за определённой папкой — отслеживает появление новых файлов. Как только новый файл появляется, скрипт отправляет его в OpenAI, чтобы расшифровать — то есть выполнить транскрибацию и получить текст. Затем этот текст автоматически помещается в мой дневник, который ведётся в Obsidian.

Рай, ты не знаешь, что такое Obsidian? Ну, это по умолчанию просто редактор Markdown-файлов, но у них есть сервис, который синхронизирует данные. Да, ты им как раз пользуешься.

Соответственно, у меня есть локальная копия Obsidian — там просто редактируются Markdown-файлы и вставляется нужный текст. По сути, это моя последняя (текущая) дневниковая запись с правильным временем (timestamp), нужным форматированием и так далее. Таким образом ведётся текстовый дневник, где можно писать развёрнуто.

Например, я могу в потоке говорить минут десять — о том, что происходит, как я себя чувствую. При этом мне не нужно сидеть и что-то писать: всё происходит естественно, в режиме озвучивания. Главное — чтобы этот процесс был максимально лёгким и необременительным (effortless).

Не отличается по размеру, типу форматирования — если там какие-то теги, умная разметка или что-то подобное в этом файле? Или, может, ты можешь показать?

Слушай, мне сейчас сложно будет, потому что там куча всего личного. Если я сейчас начну делиться, представьте себе просто… Я могу показать этот… У меня где-то сохранилась презентация, которую «Крует Мэн» готовил, рассказывая об этом. Она немного… Сейчас посмотрим, насколько она актуальна. Может, из неё что-то покажу. Давайте сейчас быстро откроем и посмотрим, что там есть.

А, вот, да — там есть пример. Сейчас быстренько поделюсь экраном.

Continue to share.

Да, телефон с Obsidian, MacBook с Obsidian, Cloud Code тоже, Mac mini как сервер — и по сути он помогает обрабатывать текст. Я сейчас объясню, что имеется в виду.

Вот, курсор… Кстати, я уже не пользуюсь курсором, если честно.

Итак, вот как выглядит примерно моя типичная дневниковая заметка. Есть какие-то задачи. Но сами задачи не находятся внутри заметки — это отдельная история, как я веду таски в Obsidian.

Но дальше идут записи течения дня. Можно увидеть отметки времени — например, 9:45 — и мою оценку состояния. У меня используется десятибалльная шкала, причём логарифмическая. То есть 3 — это хорошо. 3 — это нормальное, обычное состояние. Всё, что выше трёх, — это уже переживание красоты, радости и всего такого.

Потом просто записи: «хочу запостить про OneSec», «Read it», «update strategy», «draft new», «how to get to million paying creators», «feeling where you come», «relax after meditation».

В общем, это просто набор записей — иногда коротких, иногда очень длинных. Представьте, я 15 минут наговариваю что-то на часы, затем это транскрибируется и вставляется в Obsidian сплошным текстом и так далее.

Дальше, если кто-то не понял — это нативное приложение Voice Notes на телефоне, никаких плагинов, никаких шорткатов, просто штатное голосовое приложение.

Да, да, да.

И сейчас я могу показать, потому что тогда я это ещё не показал.

Вот, «currently working on». Хотя, на самом деле, уже сделал. То есть оно уже работает.

Смысл в том, что голосовые заметки идут с часов в приложение Voice Notes. Или можно как-то в Zoom? Давайте сделаем аннотацию.

Вот они — Voice Notes.

Итак, Voice Notes синхронизируются через iCloud на Mac mini (сервер). Далее специальный процесс отслеживает, появились ли новые Voice Notes, отправляется в OpenAI, получает транскрипцию, после чего сам голосовой файл удаляется, а текст попадает в Obsidian. То есть транскрибированный текст автоматически появляется у меня прямо в приложении Obsidian.


Knowlume

Этот кейс был за пару минут извлечен из источника с помощью Knowlume

Связаться с разработчиком
Сайт Knowlume
Подписка на Knowlume через Tribute