Безопасны ли и конфиденциальны ли онлайн-услуги транскрипции?

Транскрипция когда-то была ручным, утомительным процессом. Врачи, журналисты и множество профессионалов записывали свои записи и разговоры на колючую диктофонную ленту, а затем садились перед своими компьютерами и печатали их.

Перенесемся в 2020 год, и есть множество сервисов, которые вы можете использовать для превращения аудиозаписи в текст на экране компьютера. Однако остается один вопрос: безопасны ли они? В конце концов, вы можете загружать голосовые записи конфиденциальных разговоров и частную голосовую почту.

Давайте посмотрим на эти услуги и на то, как вы можете защитить свою информацию.

Как работают службы транскрипции аудио

Услуги по транскрипции аудио делятся на три группы. Первый полностью управляется компьютером и использует существующие модели искусственного интеллекта и машинного обучения для обработки разговора. Второй — самый дорогой, потому что люди делают тяжелую работу. Третий — комбинация компьютерной обработки и человека.

Скорее всего, вы больше всего знакомы с первой категорией. Услуги голосовой транскрипции — например, предлагаемые Google, Apple и Otter.ai— преобразовать аналоговые волны, создаваемые вашим голосом, в цифровое представление. Затем он разбивает их на небольшие (иногда до одной тысячной доли секунды) сегменты и сопоставляет их с известными «фонемами» или элементами языка.

Затем эти алгоритмы пытаются исследовать их в контексте других фонем и применять статистические модели и модели искусственного интеллекта, которые в конечном итоге создают текст. Поскольку эти службы транскрипции полностью управляются компьютером, они, как правило, самые недорогие в эксплуатации. Однако точность не всегда актуальна, особенно когда дело доходит до извлечения текста из шумной или многопользовательской среды.

Транскрипция с участием человека включает специальные платформы, такие как Rev, которые соединяют клиентов с пулом предварительно утвержденных транскриберов. Вы также можете нанять кого-нибудь на рынке фрилансеров, например Upwork или же Фиверр, расшифровать для вас.

Наконец, есть сочетание двух. Чтобы ускорить процесс транскрипции, некоторые сайты позволяют ИИ выполнять предварительную работу, а затем кто-то приводит в порядок результат и исправляет любые ошибки.

Службы транскрипции работают плохо

Палец касается динамика Amazon Echo.

В последние годы многие сервисы транскрипции стали объектом взломов и скандалов.

Возможно, самым старым (и, пожалуй, самым шокирующим) был SpinVox, который в нулевых предлагал сервис, превращавший голосовую почту в SMS-сообщения. В то время это считалось не чем иным, как технологическим прорывом. Фирма быстро привлекла положительную прессу, клиентов и огромные источники финансирования.

Проблема? Без ведома клиентов их голосовые сообщения были обрабатываются людьми, работающими в офисах в таких местах, как Пакистан, Маврикий и Южная Африка. Один инсайдер компании заявил, что только 2 процента голосовых сообщений обрабатывались машинами, а остальные обрабатывались примерно 10 000 эксплуатируемыми рабочими.

Когда сотрудники пакистанского офиса SpinVox не получили зарплату, они начали отправлять сообщения прямо клиентам в знак протеста. В конце концов правда вышла наружу, и SpinVox потерял большую часть своей ценности. В конечном итоге остатки компании были проданы Нюанс, один из крупнейших в мире поставщиков услуг распознавания голоса.

Совсем недавно журналист по вопросам кибербезопасности Брайан Кребс обнаружил серьезное нарушение, произошедшее в MEDantex, базирующийся в Канзасе провайдер услуг по транскрипции голоса для медицинских работников. Как и ожидалось, произошла утечка данных (некоторые из которых датированы 2007 годом), содержащих конфиденциальные медицинские записи. Содержимое может быть загружено с небезопасного портала в виде файлов Microsoft Word.

Даже услуги цифровой транскрипции небезопасны. В конце концов, когда вы пользуетесь услугами, полностью управляемыми компьютером, фирма может привлекать людей-подрядчиков для контроля качества.

В 2019 году бельгийский новостной сайт VRT NWS, обнаружил, что подрядчики Google слушают разговоры между людьми и их умными помощниками Google Home. Один подрядчик даже предоставил VRT NWS доступ к разговорам, многие из которых носили очень деликатный (а в некоторых случаях и сексуально интимный) характер.

Amazon, Apple и Microsoft также использовали подрядчиков таким образом. Другими словами, кто-то может слушать голосовые записи вашего виртуального помощника.

Безопасны ли онлайн-услуги транскрипции?

Женщина в наушниках и печатает на ноутбуке.

Наиболее актуальный вопрос — безопасны ли онлайн-сервисы транскрипции. К сожалению, ответ немного сложен.

На данный момент пространство для транскрипции голоса в значительной степени созрело. Были отсеяны самые вопиющие плохие актеры.

Тем не менее, когда вы доверяете свои данные (в данном случае частные разговоры) третьей стороне, вы полагаетесь на ее защиту. Это так же верно для онлайн-сервисов, как и для людей-транскриберов.

В конечном итоге вы должны спросить себя о двух вещах: доверяете ли вы сервису и насколько деликатны ваши разговоры?

Когда вы ищете службу транскрипции, всегда стоит провести некоторое исследование. У компании хорошая репутация? Это хорошо установлено? Были ли данные в прошлом нарушены? Существует ли политика конфиденциальности, в которой четко прописано, как будут обрабатываться и защищаться ваши данные?

Как мы упоминали ранее, сервисы на основе ИИ часто полагаются на сотрудников и сторонних подрядчиков для проведения проверок контроля качества. Хотя эти проверки представляют собой небольшую часть всех транскрипций, всегда есть шанс, что кто-то будет слушать ваш разговор.

Однако во многих случаях это не помешает. Однако, если ваш разговор носит глубоко личный или коммерческий характер, вы можете рассмотреть возможность открытия текстового редактора и его расшифровки старомодным способом.