🗣Голосовой AI-ассистент на Python (Streamlit, Whisper, ChatGPT, TTS)
Пишем готовий проект на Python.
Проект объединяет несколько компонентов:
- Распознавание речи: отправка аудио на OpenAI Whisper API (модель whisper-1) для транскрипции русской речиkdnuggets.com.
- Генерация ответа: отправка полученного текста в OpenAI ChatCompletion (модель gpt-3.5-turbo) для получения ответа в виде текстаgokhang1327.medium.com.
- Синтез речи (TTS): два варианта генерации звука из текста: платный сервис ElevenLabs (реалистичные голоса, поддержка русского) и открытая модель Silero TTS (бесплатная, поддерживает русский)github.comgithub.com.
- Интерфейс: веб-приложение на Streamlit с виджетом записи аудио (микрофон) и областью для отображения распознанного текста и ответа.
Ниже приведён подробный код приложения и инструкции по его запуску.
🗣Голосовой AI-ассистент на Python (Streamlit, Whisper, ChatGPT, TTS)
Пишем готовий проект на Python.
Проект объединяет несколько компонентов:
- Распознавание речи: отправка аудио на OpenAI Whisper API (модель whisper-1) для транскрипции русской речиkdnuggets.com.
- Генерация ответа: отправка полученного текста в OpenAI ChatCompletion (модель gpt-3.5-turbo) для получения ответа в виде текстаgokhang1327.medium.com.
- Синтез речи (TTS): два варианта генерации звука из текста: платный сервис ElevenLabs (реалистичные голоса, поддержка русского) и открытая модель Silero TTS (бесплатная, поддерживает русский)github.comgithub.com.
- Интерфейс: веб-приложение на Streamlit с виджетом записи аудио (микрофон) и областью для отображения распознанного текста и ответа.
Ниже приведён подробный код приложения и инструкции по его запуску.
Secure video calling is in high demand. As an alternative to Zoom, many people are using end-to-end encrypted apps such as WhatsApp, FaceTime or Signal to speak to friends and family face-to-face since coronavirus lockdowns started to take place across the world. There’s another option—secure communications app Telegram just added video calling to its feature set, available on both iOS and Android. The new feature is also super secure—like Signal and WhatsApp and unlike Zoom (yet), video calls will be end-to-end encrypted.
Tata Power whose core business is to generate, transmit and distribute electricity has made no money to investors in the last one decade. That is a big blunder considering it is one of the largest power generation companies in the country. One of the reasons is the company's huge debt levels which stood at ₹43,559 crore at the end of March 2021 compared to the company’s market capitalisation of ₹44,447 crore.