Для решения задачи effortless-фиксации мыслей используется автоматическая транскрибация голосовых заметок через OpenAI и интеграция текста в Obsidian с помощью скрипта на Mac Mini
Транскрибированный текст автоматически появляется в Obsidian с правильным форматированием и временной меткой, а исходный аудиофайл удаляется.
Источник: FOS 12 // Intention OS: как CEO ManyChat Майк Ян строит систему осознанности
Связка 1
Начальное состояние: Голосовая заметка записана на Apple Watch с помощью встроенного приложения Voice Memos.
Преобразование: Заметка синхронизируется через iCloud на Mac Mini, где скрипт автоматически обнаруживает файл, отправляет его в OpenAI для транскрибации, а затем вставляет полученный текст в текущую дневниковую запись в Obsidian.
Конечное состояние: Транскрибированный текст автоматически появляется в Obsidian с правильным форматированием и временной меткой, а исходный аудиофайл удаляется.
OneSec — это один из примеров. Мы с тобой уже обсуждали Obsidian, искусственный интеллект и всю эту систему. Там история немного шире.
Дело в том, что в течение дня, помимо обычного дневника в календаре, я периодически записываю голосовые заметки на часах — буквально в два нажатия. У меня прямо в сборке на Apple Watch лежат встроенные Voice Memos из iOS. Нажимаешь одну кнопку, затем большую красную — и начинается запись.
Эти голосовые заметки синхронизируются через iCloud с моим аккаунтом. Дома у меня стоит Mac Mini, работающий в роли сервера, который подключён к тому же iCloud. В какой-то момент после синхронизации файлы появляются на нём локально.
На этом Mac Mini я настроил скрипт, который по сути следит за определённой папкой — отслеживает появление новых файлов. Как только новый файл появляется, скрипт отправляет его в OpenAI, чтобы расшифровать — то есть выполнить транскрибацию и получить текст. Затем этот текст автоматически помещается в мой дневник, который ведётся в Obsidian.
Рай, ты не знаешь, что такое Obsidian? Ну, это по умолчанию просто редактор Markdown-файлов, но у них есть сервис, который синхронизирует данные. Да, ты им как раз пользуешься.
Соответственно, у меня есть локальная копия Obsidian — там просто редактируются Markdown-файлы и вставляется нужный текст. По сути, это моя последняя (текущая) дневниковая запись с правильным временем (timestamp), нужным форматированием и так далее. Таким образом ведётся текстовый дневник, где можно писать развёрнуто.
Например, я могу в потоке говорить минут десять — о том, что происходит, как я себя чувствую. При этом мне не нужно сидеть и что-то писать: всё происходит естественно, в режиме озвучивания. Главное — чтобы этот процесс был максимально лёгким и необременительным (effortless).
Не отличается по размеру, типу форматирования — если там какие-то теги, умная разметка или что-то подобное в этом файле? Или, может, ты можешь показать?
Слушай, мне сейчас сложно будет, потому что там куча всего личного. Если я сейчас начну делиться, представьте себе просто… Я могу показать этот… У меня где-то сохранилась презентация, которую «Крует Мэн» готовил, рассказывая об этом. Она немного… Сейчас посмотрим, насколько она актуальна. Может, из неё что-то покажу. Давайте сейчас быстро откроем и посмотрим, что там есть.
А, вот, да — там есть пример. Сейчас быстренько поделюсь экраном.
Continue to share.
Да, телефон с Obsidian, MacBook с Obsidian, Cloud Code тоже, Mac mini как сервер — и по сути он помогает обрабатывать текст. Я сейчас объясню, что имеется в виду.
Вот, курсор… Кстати, я уже не пользуюсь курсором, если честно.
Итак, вот как выглядит примерно моя типичная дневниковая заметка. Есть какие-то задачи. Но сами задачи не находятся внутри заметки — это отдельная история, как я веду таски в Obsidian.
Но дальше идут записи течения дня. Можно увидеть отметки времени — например, 9:45 — и мою оценку состояния. У меня используется десятибалльная шкала, причём логарифмическая. То есть 3 — это хорошо. 3 — это нормальное, обычное состояние. Всё, что выше трёх, — это уже переживание красоты, радости и всего такого.
Потом просто записи: «хочу запостить про OneSec», «Read it», «update strategy», «draft new», «how to get to million paying creators», «feeling where you come», «relax after meditation».
В общем, это просто набор записей — иногда коротких, иногда очень длинных. Представьте, я 15 минут наговариваю что-то на часы, затем это транскрибируется и вставляется в Obsidian сплошным текстом и так далее.
Дальше, если кто-то не понял — это нативное приложение Voice Notes на телефоне, никаких плагинов, никаких шорткатов, просто штатное голосовое приложение.
Да, да, да.
И сейчас я могу показать, потому что тогда я это ещё не показал.
Вот, «currently working on». Хотя, на самом деле, уже сделал. То есть оно уже работает.
Смысл в том, что голосовые заметки идут с часов в приложение Voice Notes. Или можно как-то в Zoom? Давайте сделаем аннотацию.
Вот они — Voice Notes.
Итак, Voice Notes синхронизируются через iCloud на Mac mini (сервер). Далее специальный процесс отслеживает, появились ли новые Voice Notes, отправляется в OpenAI, получает транскрипцию, после чего сам голосовой файл удаляется, а текст попадает в Obsidian. То есть транскрибированный текст автоматически появляется у меня прямо в приложении Obsidian.

Этот кейс был за пару минут извлечен из источника с помощью Knowlume
Связаться с разработчиком
Сайт Knowlume
Подписка на Knowlume через Tribute