Python для творческих. Звук на твоей стороне.

Александр Иванов

Рейтинг Литрес:5

Рейтинг Livelib:5

Издательство:

SelfPub

Метки:

обучение программированию,автоматизация,язык Python,программирование звука,звукозапись,только на Литрес,Литрес Авторы

Жанры:

учебная литература,программирование,книги о компьютерах

Книжный блогЧитать новые статьи

Последние статьи блога

Как быстро выучить тренд

Как быстро выучить чеченский язык

Как легко выучить спряжение глаголов и исключения

Как легко выучить состав числа до 10

Аннотация

Читать онлайн

Cкачать на Литрес

-
100%
+

***

Предисловие

Эта книга написана для тех, кто создаёт контент со звуком и хочет, чтобы он звучал профессионально. Неважно, записываете ли вы подкаст в своей спальне, снимаете обучающие видео для YouTube, озвучиваете презентации или ведёте онлайн-курсы. Неважно, сколько у вас подписчиков — десять или десять тысяч. Ваш голос заслуживает того, чтобы звучать чисто, ровно и уверенно.

Обработка звука часто воспринимается как что-то сложное, требующее дорогого оборудования, специального образования и профессионального звукорежиссёра. Это правда лишь отчасти. Да, профессиональные студии творят чудеса. Но базовые вещи — убрать шум, выровнять громкость, вырезать паузы и слова-паразиты, наложить фоновую музыку — можно сделать самому. И для этого не нужен звукорежиссёр. Нужен Python.

Python — это язык программирования. Не пугайтесь этих слов. Python прост. Он читается почти как английский текст. Освоить его на уровне, достаточном для обработки звука, может любой человек, умеющий пользоваться компьютером. Я не шучу. Первая глава этой книги начинается с установки Python и первой строчки кода. Если вы никогда не программировали — вы справитесь. Если программировали — будет ещё проще.

Почему Python, а не готовые программы вроде Audacity или Adobe Audition? Потому что готовые программы хороши для разовой ручной обработки. Открыли файл, подвинули ползунки, сохранили. Но когда у вас двадцать выпусков подкаста и в каждом нужно сделать одно и то же — убрать шум холодильника, нормализовать громкость, вырезать длинные паузы и вставить джинглы, — ручная обработка превращается в ад. Вы сидите, повторяете одни и те же действия раз за разом, тратите часы. Python позволяет автоматизировать всё это. Вы один раз пишете скрипт, а потом запускаете его для любого количества файлов. Пока скрипт работает, вы пьёте кофе. Или записываете новый выпуск. Или гуляете.

Эта книга — не учебник по программированию и не справочник по всем возможностям Python. Это практическое руководство по обработке звука для создателей контента. Мы пройдём путь от установки необходимых инструментов до полностью автоматического конвейера, который превращает сырую запись в готовый продукт. Мы научимся загружать аудиофайлы и анализировать их характеристики. Мы освоим монтаж кодом — обрезку, склеивание, нормализацию громкости. Мы будем убирать шум тремя разными способами. Мы найдём и удалим длинные паузы и слова-паразиты. Мы научимся менять голос для создания персонажей и накладывать фоновую музыку так, чтобы она не заглушала речь. И в конце мы соберём всё это в один большой скрипт, который делает всю работу за вас.

Каждая глава построена по единому принципу. Сначала я показываю проблему — знакомую ситуацию, с которой вы наверняка сталкивались. Затем мы разбираем, как эту проблему решить. Я даю код — его можно копировать и вставлять, он проверен и работает. После кода идёт подробный разбор каждой строчки, чтобы вы не просто повторяли, а понимали. Затем — раздел о типичных ошибках и способах их исправления. И наконец — творческое задание для тех, кто хочет экспериментировать.

Книгу можно читать последовательно, от начала до конца, а можно использовать как справочник: открыли нужную главу, скопировали код, решили проблему, закрыли. Оба подхода рабочие.

Для работы с книгой вам понадобится компьютер и желание. Всё остальное — Python, библиотеки, примеры — я дам. Код из книги можно копировать и вставлять. Вам не нужно быть программистом. Вам нужно быть человеком, который хочет, чтобы его контент звучал лучше.

Я благодарю сообщество разработчиков открытого программного обеспечения, создавших библиотеки librosa, numpy, noisereduce и десятки других инструментов, на которых построена эта книга. И я благодарю вас, читатель, за то, что взяли эту книгу в руки и решили инвестировать время в улучшение своего контента. Это решение окупится.

Поехали.

Введение. Почему Python, а не Audacity?

Для кого эта книга

Представьте: вы записали классное видео для YouTube. Свет выставлен идеально, сценарий выверен до секунды, шутки отрепетированы перед зеркалом. Вы нажимаете «экспорт» и с предвкушением ждете реакцию зрителей.

А потом открываете комментарии. И вместо обсуждения ваших гениальных мыслей видите: «Ничего не слышно», «Звук как из бочки», «Автор, купи нормальный микрофон».

Обидно? Еще как. Знакомо? Большинству контент-креаторов — да.

Эта книга для тех, кто хочет управлять звуком так же легко, как текстом или картинкой. Вы не должны становиться профессиональным звукорежиссером. Вы не обязаны тратить часы на изучение сложных программ вроде Audacity, Adobe Audition или Reaper. Ваша задача — создавать контент. А звук должен просто работать. И Python сделает его таким.

Почему именно Python, а не готовый софт с ползунками и кнопками? Давайте разберемся.

Три причины выбрать Python для работы со звуком

Причина первая: автоматизация.

Предположим, у вас есть подкаст из двадцати выпусков. В каждом выпуске нужно убрать фоновый шум от кондиционера, нормализовать громкость и вырезать неловкие паузы. В Audacity вы делаете это вручную: открываете файл, применяете эффект, ждете, сохраняете, открываете следующий. Двадцать раз.

На Python вы пишете скрипт один раз. И запускаете его для всех файлов одной командой. Пока Audacity еще открывается, ваш скрипт уже закончил работу и пошел пить кофе.

Причина вторая: контроль.

В графическом редакторе вы двигаете ползунок «Убрать шум» и надеетесь на лучшее. Вы не знаете, что именно происходит со звуком. Вам говорят: «Применить шумоподавление?» — вы нажимаете «Да». Результат иногда радует, иногда огорчает, но вы не понимаете почему.

Код не скрывает от вас ничего. Вы говорите: «Вот этот диапазон частот ослабить на 12 децибел». И он ослабляет именно этот диапазон. Вы говорите: «Найти участки тишины длиннее полсекунды и обрезать их до четверти секунды». И он делает именно это. Полный контроль. Никакой магии.

Причина третья: воспроизводимость.

Выпустили подкаст. Через неделю поняли, что в третьей минуте остался щелчок, который вы не заметили. В Audacity это означает: открыть проект, найти то место, исправить, снова экспортировать. Минут десять ручной работы.

В Python это означает: подправили одну строку в скрипте, перезапустили — готово. Ваш процесс обработки звука становится документированным, повторяемым и неубиваемым. Вы всегда можете вернуться и улучшить результат, не начиная с нуля.

Что такое звук с точки зрения Python

Давайте договоримся о главном прямо сейчас. Когда вы слышите слово «код», у вас в голове, возможно, всплывает образ хакера в капюшоне, который стучит по клавишам под зеленые строчки, падающие сверху. Забудьте.

Код — это просто инструкция. Написанная на человеческом языке, просто немного более строгом, чем обычно.

Вот пример инструкции для человека:

«Возьми аудиофайл, найди в нем все места, где громкость ниже порога слышимости, и удали их».

А вот та же инструкция для Python:

python

import librosa

import soundfile as sf

y, sr = librosa.load('podcast.wav')

y_trimmed, _ = librosa.effects.trim(y, top_db=20)

sf.write('podcast_clean.wav', y_trimmed, sr)

Прямо сейчас это может выглядеть непонятно. Но к концу этой книги вы будете читать такой код как родной. Обещаю.

Звук для Python — это просто массив чисел. Представьте себе очень длинный ряд значений громкости, измеренных сорок четыре тысячи раз в секунду. Каждое число — это положение мембраны вашего динамика в конкретный момент времени. Положительное число — мембрана идет вперед, отрицательное — назад, ноль — покой.

Ваш голос, музыка, шум ветра, лай собаки за окном — все это превращается в столбики чисел. И Python умеет с этими столбиками работать быстрее, чем любой графический редактор.

Что вам понадобится

Никакого специального оборудования. Никаких платных программ. Только три вещи:

Первое: компьютер.

Подойдет любой — Windows, Mac, Linux. Python работает везде одинаково. Если ваш компьютер способен открыть браузер и не зависнуть, он справится с обработкой аудио.

Второе: Python версии 3.9 или новее.

Если у вас еще нет Python — не пугайтесь. Следующий раздел проведет вас через установку за десять минут. Это действительно просто: скачали установщик, нажали «Далее» несколько раз, готово.

Третье: желание автоматизировать рутину и вернуть себе время.

Оно у вас уже есть, раз вы открыли эту книгу.

Как устроена эта книга

В этой книге девять глав. Каждая глава — это одна конкретная задача, с которой сталкивается любой создатель контента. Никакой абстрактной теории в вакууме. Только реальные проблемы и их решения.

Каждая глава построена по одному и тому же принципу:

В чем проблема. Я описываю ситуацию из жизни. Возможно, вы узнаете себя.

Как мы будем ее решать. Коротко о том, какой инструмент применим и почему.

Код. Пошагово, с объяснением каждой строчки. Вы можете копировать его и запускать сразу.

Лаборатория ошибок. Что может пойти не так и как это исправить. Потому что идеальных запусков с первого раза не бывает ни у кого.

За кулисами. Для любопытных: как это работает внутри. Этот раздел можно пропустить, если хочется просто получить результат. Но если вы хотите понимать, что именно происходит со звуком, — welcome.

Творческий практикум. Что еще можно сделать с этим же инструментом, чтобы ваш контент стал еще круче.

Чек-лист. Краткое резюме главы. Пробежались глазами — вспомнили главное.

Книгу можно читать последовательно, от корки до корки, а можно использовать как справочник: открыли нужную главу, скопировали код, решили проблему, закрыли. Оба подхода рабочие.

Установка Python за десять минут

Давайте сделаем это прямо сейчас, чтобы потом не отвлекаться. Выполните следующие шаги — и через десять минут Python будет готов к работе.

Шаг 1. Скачиваем Python.

Откройте официальный сайт python.org. Прямо на главной странице вы увидите большую желтую кнопку «Download Python 3.x» — где x заменяется на самую свежую версию. На момент написания книги это 3.12, но подойдет любая версия, начиная с 3.9. Смело нажимайте кнопку. Скачивается установщик.

Шаг 2. Запускаем установку.

Нашли скачанный файл, запустили. Внимание: на первом экране установщика есть важная галочка внизу — «Add Python to PATH». Обязательно поставьте ее. Если пропустите — Python установится, но командная строка не будет знать, где он лежит. Поставили галочку? Жмите «Install Now».

Подождите минуту. Готово.

Шаг 3. Проверяем.

Теперь проверим, что все работает. Откройте программу «Командная строка» на Windows (нажмите Win, начните вводить cmd, нажмите Enter) или «Терминал» на Mac и Linux.

В открывшемся окне введите:

bash

python --version

И нажмите Enter. Если вы увидели строчку вроде Python 3.12.1 — поздравляю, Python с вами.

Если вы увидели ошибку — скорее всего, вы пропустили галочку «Add Python to PATH». Ничего страшного: переустановите Python и на этот раз обязательно поставьте галочку. Это самая частая проблема, она решается за две минуты.

Шаг 4. Устанавливаем библиотеки.

Сам по себе Python — это как пустая кухня. Плита есть, а продуктов нет. Нам нужно «закупить продукты» — библиотеки для работы со звуком.

В той же командной строке выполните три команды подряд, нажимая Enter после каждой:

bash

pip install librosa

pip install soundfile

pip install noisereduce

Пойдут строчки с процентами, скачиваниями, установками. Когда все закончится, командная строка снова будет ждать вашего ввода. Это значит — все установлено успешно.

Если команда pip не распознается — попробуйте pip3 вместо pip. Это случается на некоторых Mac и Linux. То есть вводите pip3 install librosa и так далее.

Шаг 5. Ваш первый скрипт.

Давайте удостоверимся, что все работает как надо. Создайте на рабочем столе папку audio_book. Внутри нее создайте текстовый файл с именем hello_sound.py.

Внимание: расширение должно быть именно .py, а не .txt. Windows по умолчанию скрывает расширения файлов, поэтому то, что вы видите как hello_sound, на самом деле может быть hello_sound.py.txt. Чтобы этого избежать, откройте проводник, перейдите на вкладку «Вид», поставьте галочку «Расширения имен файлов». Теперь вы видите все расширения и можете создавать .py файлы правильно.

Откройте hello_sound.py в любом текстовом редакторе. Можно в стандартном Блокноте, но лучше скачать бесплатный VS Code — он умеет подсвечивать код разными цветами, что сильно облегчает жизнь.

Вставьте в файл эти четыре строки:

python

import librosa

print("Библиотека librosa готова к работе!")

print("Звук на твоей стороне.")

Сохраните файл. Теперь вернитесь в командную строку. Нам нужно перейти в папку audio_book. Если она у вас на рабочем столе, команда будет такой:

bash

cd Desktop/audio_book

Нажмите Enter. Командная строка теперь находится внутри вашей папки. Запустите скрипт:

bash

python hello_sound.py

Если вы увидели на экране:

text

Библиотека librosa готова к работе!

Звук на твоей стороне.

— то всё готово. Вы только что написали и запустили свой первый Python-скрипт. Добро пожаловать в мир, где звук вам подчиняется.

Пара слов перед стартом

Эта книга писалась для человека, который никогда не программировал. Или программировал когда-то давно и с тех пор забыл всё, кроме слова «переменная». Я буду объяснять каждую строчку кода, как если бы вы увидели ее впервые в жизни. Если вы уже знаете Python — отлично, читать будет еще быстрее. Но база заложена с расчетом на полного новичка.

Второе: не бойтесь ошибок. Ошибка в коде — это не провал. Это способ языка сказать: «Я тебя не понял, давай уточним». Программисты с двадцатилетним стажем до сих пор гуглят сообщения об ошибках ежедневно. Это нормальная часть работы, а не показатель некомпетентности.

Третье: в каждой главе вы будете получать готовый работающий инструмент. Берите его, применяйте к своему контенту, улучшайте, ломайте, чините. Код из этой книги — ваш. Никаких лицензий, никаких ограничений.

Что вы будете уметь после этой книги

Давайте начистоту. Я не буду обещать, что после этой книги вы станете звукорежиссером уровня голливудских студий. Это было бы враньем. Но вот что вы будете уметь точно — конкретно и измеримо:

Вы сможете взять сырую запись своего голоса, сделанную в обычной комнате с обычным микрофоном, и превратить ее в чистый, сочный, профессионально звучащий трек. Не за час ручной работы. За тридцать секунд автозапуска скрипта.

Вы научитесь убирать фоновый шум. Тот самый гул холодильника, который почему-то становится слышен именно тогда, когда вы говорите что-то важное. Тот шум улицы, который пробивается даже сквозь закрытые окна. Тот шипящий фон дешевого микрофона, который выдает в вас любителя за километр.

Вы сможете находить и удалять паузы. Не вручную, прокручивая ползунок туда-сюда и мучительно вылавливая взглядом провалы на звуковой дорожке. А одной командой. Все паузы длиннее полусекунды — бах, и сокращены до комфортного размера. Ваш подкаст становится плотнее, энергичнее, профессиональнее.

Вы освоите нормализацию громкости. Ваши видео на YouTube перестанут звучать тише, чем реклама перед ними. Ваш подкаст будет одинаково хорошо слышен и в метро, и в тихой комнате. Зрителям больше не придется дергать ползунок громкости туда-сюда — они будут просто слушать.

Вы сможете менять голос. Хотите озвучить персонажа с низким демоническим тембром? Сделать забавного робота для детского видео? Превратить свой голос в голос белки-летяги для комедийной вставки? Всё это будет делаться парой строк кода.

Вы соберете автоматический микс голоса и фоновой музыки. Чтобы музыка не забивала речь, а аккуратно поддерживала настроение. Чтобы голос всегда был на первом плане, а музыка уходила на второй, когда вы говорите, и возвращалась, когда вы замолкаете. Без ручной автоматизации. Без нервов.

Вы наложите финальный лоск — эквализацию и компрессию, которые превращают обычный голос в «радио-голос». Тот самый бархатный, глубокий, обволакивающий тембр, который заставляет людей дослушивать до конца и спрашивать: «А на чем ты записываешь?»

И самое главное: вы построите свою звуковую кухню. Набор скриптов, которые работают именно с вашим голосом, именно под ваши задачи. Не универсальные настройки из интернета, которые подходят «всем понемногу, но никому конкретно». А инструмент, заточенный под вас.

История автора: как я пришел к Python и звуку

Знаете, с чего начался мой путь в обработке звука? С позора. Самого настоящего, жгучего позора.

Я записал свой первый подкаст. Мне казалось, что это шедевр. Тема была огненная, мысли — глубокие, шутки — смешные. Я залил выпуск на площадку и лег спать с чувством выполненного долга. Мне снились восторженные комментарии и графики растущих прослушиваний.

Проснулся я от первого комментария. Он гласил: «Слушал в машине. Ничего не понял. Сделай погромче, а?»

Второй был хуже: «Звук как из ведра. Автор, ты в колодце сидишь?»

Третий добил: «Бросил на второй минуте. Уши устали продираться сквозь шум».

Я был раздавлен. Я вложил душу в содержание. Но слушателю было плевать на содержание, потому что форма не пускала его внутрь. Звук поставил стену между мной и аудиторией. И я ничего не мог с этим сделать.

Вернее, мог. Я открыл Audacity. И провел в нем четыре часа. Четыре часа я двигал ползунки, применял эффекты, отменял, применял другие, слушал результат, сравнивал, снова отменял. В итоге я получил звук немного лучше, но все еще далекий от идеала. А главное — я не понимал, что именно я сделал. Я не мог повторить этот результат для следующего выпуска. Каждый раз начиналась та же битва с ползунками.

Тогда я подумал: «Я же программист. Почему я занимаюсь ручным трудом, который можно автоматизировать?»

Я открыл Python. Установил librosa. И написал свой первый скрипт для очистки звука. Он работал отвратительно. Звук после обработки напоминал голос робота, говорящего из бочки с водой. Но я хотя бы понимал, что именно я сделал не так.

Через неделю экспериментов мой скрипт чистил звук лучше, чем я вручную в Audacity. Через месяц я мог обработать весь выпуск одной командой. Через три месяца друзья начали спрашивать: «Слушай, а что у тебя за микрофон? Звучит бомбически».

Микрофон был тот же самый, что и в первом позорном выпуске. Просто теперь между ним и слушателем стоял Python.

Эта книга — способ передать вам тот путь, который я прошел за месяцы, но в сжатом и понятном виде. Вы пройдете его за девять глав. И вам не придется набивать шишки, на которых набивал шишки я.

Ответы на страхи: «Я гуманитарий и боюсь кода»

Если вы прямо сейчас думаете: «Это все круто, но я гуманитарий. Я боюсь кода. Я не понимаю математику. Я не технарь. У меня не получится», — пожалуйста, прочитайте следующие четыре абзаца внимательно.

Первое. Код — это не магия, не математика и не инопланетный язык. Код — это инструкция, записанная в особой форме. Если вы можете объяснить другому человеку, как сделать бутерброд — пошагово, в правильной последовательности, с учетом всех деталей, — вы можете писать код. Потому что программирование — это просто умение раскладывать задачу на шаги.

Второе. В этой книге нет математики. Серьезно. Ни одной формулы, которую нужно было бы запомнить. Ни одного математического доказательства. Все, что делает Python под капотом, я объясняю через метафоры и аналогии. Фурье-преобразование? Я расскажу вам, что это как разложить смузи на отдельные фрукты, из которых он сделан. Спектральное вычитание? Это как убрать шум дождя из записи разговора, если у вас есть отдельная запись шума дождя. Без формул. Без интегралов. Без боли.

Третье. Вам не нужно становиться программистом. Вы не будете писать код с нуля. Вы будете копировать готовые скрипты, подставляя в них название своего файла. И запускать. Всё. Постепенно вы начнете понимать, что именно происходит в коде, и сможете его менять под свои нужды. Но это произойдет естественно, без насилия над мозгом.

Четвертое. Я проверил эту методику на живых людях. Моя жена — филолог, она до знакомства со мной никогда не открывала командную строку. Сейчас она обрабатывает свои аудиозаписи для языковых курсов с помощью скриптов, которые я ей когда-то настроил. Через месяц она уже сама поправила в них пару параметров. Через три — написала свой первый мини-скрипт для обрезки тишины в начале и конце файла. Если смогла она — сможете и вы. Филолог победил код. Код не такой страшный, как кажется.

Как пользоваться книгой: три сценария

У людей разные цели и разный стиль обучения. Я спроектировал эту книгу так, чтобы она работала для трех типов читателей. Выберите свой сценарий.

Сценарий «Дай готовое».

Вы хотите просто решить проблему со звуком и не вдаваться в детали. Отлично. Откройте нужную главу. Найдите раздел «Код». Скопируйте скрипт целиком. Подставьте название своего файла. Запустите. Результат готов. Раздел «За кулисами» пропускайте без зазрения совести. Вы пришли за инструментом — берите инструмент. Никто не заставляет вас изучать устройство дрели, чтобы просверлить дырку в стене.

Сценарий «Хочу понимать».

Вы хотите не просто применять готовые решения, но и понимать, что именно происходит. Тогда читайте главу целиком. Раздел «За кулисами» для вас — основной. После каждой главы вы будете не просто уметь чинить звук, но и понимать, почему этот метод работает, а другой нет. Через несколько глав вы начнете соединять приемы в собственные цепочки обработки. Вы будете не просто пользователем, а мастером.

Сценарий «Хочу углубиться».

Вам мало того, что в книге. Вы хотите экспериментировать, ломать и чинить, создавать свои инструменты. Тогда ваша любимая часть — «Творческий практикум» в конце каждой главы. Там я даю идеи, которые выводят за пределы основного материала. Что будет, если применить шумоподавление дважды? А если сначала изменить голос, а потом убрать шум — результат изменится? А можно ли соединить два скрипта в один конвейер? Дерзайте. Код из этой книги — ваш полигон для экспериментов.

Независимо от выбранного сценария, помните главное: вы не обязаны проходить книгу от корки до корки. Глава 4 не требует прочтения Глав 1–3. Каждая глава самодостаточна. Захотелось прямо сейчас сделать радио-голос — открыли Главу 9 и сделали. Потом понадобилось убрать шум — вернулись к Главе 4. Книга — это набор инструментов, а не роман с сюжетом. Используйте ее как удобно.

Глава 1. Знакомимся со звуком через Python

«Твой голос заслуживает того, чтобы звучать профессионально. Даже если ты записываешь на кухне с воющим холодильником»

О чём эта глава

Вы когда-нибудь открывали аудиофайл в программе и видели перед собой волны, пики и провалы? Вы смотрите на них и, возможно, думаете: «Красиво, но что с этим делать?» В этой главе мы научимся не просто смотреть на звук, а понимать его. Мы загрузим аудиофайл в Python, разберём его на составные части и узнаем о нём то, что невозможно узнать ушами. Мы узнаем его точную длительность, громкость, количество тишины и речи. А главное — мы поймём, как компьютер представляет звук внутри себя. Это фундамент, на котором строится вся дальнейшая работа. Без этого фундамента нельзя двигаться дальше, как нельзя строить дом без знания того, из чего сделан фундамент. Мы начнём с самых основ, и я обещаю: если вы никогда в жизни не писали код, через час вы напишете свой первый работающий скрипт и он сделает что-то полезное.

123>