avva: (Default)
[personal profile] avva
Месяц назад я прочитал лекцию по истории математики на иврите. С тех пор много раз собирался сесть и расшифровать ее запись в текстовый формат, чтобы легче было отредактировать и подготовить версию на русском или английском. Но все время это откладывал, потому что жалко было времени, и жалко было так скучно его тратить. Я не так быстро набираю на иврите, как по-русски или по-английски, и мне ясно было, что перевести час лекции в текст займет у меня как минимум 5, а то и 10 часов времени.

Почему-то идея заплатить кому-то, а не делать самому, мне всегда приходит на ум с большим опозданием. Но вот наконец она пришла, и я поискал услуги расшифровки аудиозаписи в текст. Оказалось, что израильские компании, занимающиеся этим, в основном заточены под расшифровку телефонных разговоров для судебных заседаний, и берут за это солидные деньги (некоторые из них, по крайней мере; большинство сайтов, в лучших традициях израильского бизнеса, не публикуют свои расценки, а просят, чтобы им позвонили или оформили запрос). Но зато я обнаружил, что по-английски такую расшифровку успешно делают задешево с помощью Mechanical Turk - платформы Амазона, позволяющей предложить армии анонимных работников умственного труда любые задания за любую плату, на которую они согласятся. Я ни разу не пользовался Механическим Турком и давно хотел попробовать, так что решил, что вот удобный случай.

Так вот, отчитываюсь. Если вкратце, то эксперимент прошел удачно. Я получил полную текстовую расшифровку своей часовой лекции на иврите, заплатив за нее примерно $30. Расшифровка отличного качества, кроме фамилий математиков и некоторых математических терминов (но этого я ожидал). До того, как я попробовал сделать это через Турка, я был готов заплатить за этот результат какому-то агентству в 3-5 раз больше (но не нашел, кому заплатить).

Теперь подробности. Я следовал почти точно рекомендациям в этой блог-записи: Cheap, Easy Audio Transcription with Mechanical Turk. Ей почти семь лет, но советами в ней можно пользоваться практически без изменений. Вот что я сделал:

- записал аудио своей лекции в отдельный MP3-файл
- с помощью программы Mp3splt нарезал звук на 5-минутные куски, всего вышло 13 кусков. Не пытался специально разбивать на паузах или еще как-то хитрить, просто по-тупому 5 минут 00 секунд на каждый кусок.
- скопировал эти 13 файлов в свой Dropbox, чтобы можно было дать на них ссылки
- зарегистрировался на сайте Турка. Вообще-то сайт требует, чтобы работодатель был из Америки, и просит ввести американский адрес. Но я ввел случайный адрес из Fake Name Generator и его это удовлетворило; баланс на своем счету оплатил израильской кредиткой без всяких проблем.
- создал шаблон задания на сайте Турка, начав с их шаблона транскрипции. Я изменил его, подчеркнув несколько раз в заголовке и описании, что речь идет о тексте на иврите, и нужно знать иврит, чтобы выполнить задание. Я полагал изначально, что на сайте можно будет каким-то образом указать, что я требую работников со знанием такого-то языка, но ничего такого я не нашел.
- следуя указаниям в той записи, на основании шаблона сделал партию из 13 заданий, каждое со своей ссылкой на свой mp3-файл, который нужно прослушать и транскрибировать. Указал, что хочу заплатить $2 за каждое задание (расшифровка 5 минут аудио). Судя по другим обсуждениям, что я нашел, за расшифровку англоязычных записей обычно платят еще раза в два меньше, но я решил, что на иврите рынок намного меньше, конкуренции меньше и цены скорее всего выше; кроме того, если честно, мне было неловко предлагать еще меньше.

(я не знаю, кто эти люди, которые выполняют задания на Турке - какие у них типичные жизненные обстоятельства. Подозреваю, что часто это бедные студенты или неработающие люди, которые зарабатывают этим не на жизнь, а на карманные деньги и мелкие расходы)
- Это важно: по умолчанию Амазон ввел на мое задание ограничение "Master Workers" - это значит, что только работники определенного элитного статуса могут его выполнять. За это ограничение Амазон также берет комиссионные 30% от всей суммы платежа. Я не хотел ограничивать пул потенциальных работников, учитывая мое требование знания иврита, так что убрал это ограничение, и это снизило мне комиссионные до стандартных 10%.
- Я дал срок в неделю на все задания, но в итоге все 13 заданий были выполнены за двое суток.
- Было несколько недоразумений, 3-4 раза, когда я в виде ответа получал что-то странное или оборванное посредине. Обычно мне тут же приходило письмо от работника, который объяснял, что случайно нажал на кнопку конца работы, и просил не отвергать задание (это влияет на их статистику, за которой следят работодатели). Во всех случаях я договаривался с ними, что они просто пришлют мне остаток по мейлу, и все это сделали. Я также мог просто открыть новый запрос на то же задание и ждать другого работника (и любопытства ради два раза так сделал).
- Несколько раз приходили уточняющие вопросы от работников. Меня удивило, что при переписке работника с работодателем Амазон просто посылает мейл от одного к другому, используя их реальные имена и адреса, и дальше они продолжают просто по мейлу. Я был уверен, что будет какая-то схема с сообщениями только с "работником/работодателем номер такой-то" через сайт.
- Я все время заходил на сайт и проверял, не сделали ли еще задания, потому что мне было любопытно и боязно, что никто не захочет делать, но я зря тратил на это время. Если бы я отнесся к этому с полным пофигизмом, то 15 минут на подготовку файлов и шаблона было бы все мои затраты времени, и я бы все равно получил те же результаты, заплатив на пару долларов больше.

Итог: 13 кусков текста. У меня заняло полчаса склеить их, пройтись и исправить основные имена/термины. Результатом очень доволен. Впредь несомненно буду пользоваться Турком для работ такого рода.

Date: 2015-06-07 10:39 pm (UTC)
oryx_and_crake: (oryx_and_crake)
From: [personal profile] oryx_and_crake
Я в последнее время присматриваюсь к приложению VoicePro - оно умеет очень много всего, но в том числе и автоматически распознавать речь из записи и превращать ее в текст. Стоит какие-то копейки и поддерживает несколько десятков языков, в том числе все разновидности английского, русский и иврит. Правда, у меня никак руки не доходят купить и попробовать на деле. Но надиктовывать сразу в текст было бы очень здорово.

Date: 2015-06-08 01:41 am (UTC)
From: [identity profile] tembel.livejournal.com
подумала, что интересно было бы таким заняться
пошла искать задания на русском, нашлось одно, 20 минут, оплата – 8 ЦЕНТОВ
8 ЦЕНТОВ
как это вообще

Date: 2015-06-08 02:31 am (UTC)
From: [identity profile] panikowsky.livejournal.com
8 ЦЕНТОВ, КАРЛ!

Date: 2015-06-08 03:15 am (UTC)
From: [identity profile] igrok2.livejournal.com
А почему не через https://www.fl.ru ?

Date: 2015-06-08 04:31 am (UTC)
From: [identity profile] solomon2.livejournal.com
Угу, я как-то давно один раз попробовал из чисто спортивного интереса, но расценки меня убедили, что это труд, недостойный человека. Пусть искусственный интеллект пашет :)

Date: 2015-06-08 05:00 am (UTC)
From: [identity profile] dims12.livejournal.com
Круто!

P.S. Интересно, это мы у них позаимствовали традицию не публиковать цены на сайтах или они у нас? :)

Date: 2015-06-08 05:31 am (UTC)
From: [identity profile] michk.livejournal.com
Позабыты хлопоты,
Остановлен бег
Вкалывают роботы,
Счастлив человек.

Date: 2015-06-08 05:49 am (UTC)
From: [identity profile] geish-a.livejournal.com
На самом деле ужасно, что за такие деньги кто-то работает... Вряд ли это люди, живущие в Африке, где на 2 доллара можно прожить день.

Date: 2015-06-08 06:08 am (UTC)
From: [identity profile] olkab.livejournal.com
В принципе, имей в виду, что я занимаюсь всякими работами, связанными с текстами.
Английский-русский-иврит.

Date: 2015-06-08 06:25 am (UTC)
From: [identity profile] avva.livejournal.com
Понял, спасибо!

Date: 2015-06-08 06:26 am (UTC)
From: [identity profile] avva.livejournal.com
Вот и мне непонятно, если честно.

Date: 2015-06-08 06:48 am (UTC)
From: [identity profile] aintlion.livejournal.com
2 $ за 5 минут аудио? Не так уж и мало.Если человек тратит на это 15 минут своего времени получается 8$/час. Не много, но и не "ужас ужас". Я например знаю, что некоторые такого рода работы, у нас в Израиле ,делают работающие в охране студенты.В ночную смену.За ночь +50 +100 шекелей кроме зарплаты.

Date: 2015-06-08 06:52 am (UTC)
From: [identity profile] jmyshanya.livejournal.com
ога, вместо разгадывания кроссвордов можно денежку заработать!

Date: 2015-06-08 07:03 am (UTC)
From: [identity profile] avva.livejournal.com
Логично, да, спасибо. Кстати, Турк показывает мне статистику, согласно которой в среднем расшифровать 5 минут занимало у работников 25 минут. Правда, это не совсем чистое время, очевидно, а время от "взял задание" до "сдал задание", в середине можно отвлекаться, заниматься мультитаскингом итд. Думаю, что у тех, кто делал это лучше других и не отвлекаясь, как раз 15-20 минут было.

Date: 2015-06-08 10:10 am (UTC)
From: [identity profile] zoff.livejournal.com
> я не знаю, кто эти люди, которые выполняют задания
> на Турке - какие у них типичные жизненные обстоятельства.
> Подозреваю, что часто это бедные студенты или неработающие
> люди, которые зарабатывают этим не на жизнь, а на карманные деньги

У NPR подкаста Planet Money был эпизод про работников Mechanical Turk, как раз на эти вопросы там пытаются ответить:

http://www.npr.org/sections/money/2015/01/30/382657657/episode-600-the-people-inside-your-machine

Date: 2015-06-08 10:26 am (UTC)
From: [identity profile] avva.livejournal.com
Спасибо, послушаю.

Date: 2015-06-08 10:26 am (UTC)
From: [identity profile] injj.livejournal.com
Извините, что вмешиваюсь. Расшифровка 5 минут занимает от 25 до 40 минут, в зависимости от качества записи, обилия терминов и опыта расшифровщика. Расшифровка часа - от 6 до 10 часов.
Был опыт. Труд действительно нечеловеческий и очень, очень малооплачиваемый.

Date: 2015-06-08 10:33 am (UTC)
From: [identity profile] avva.livejournal.com
Спасибо!

Date: 2015-06-08 11:01 am (UTC)
From: [identity profile] mikkim08.livejournal.com
Все-таки интересно, можно ли на стороне работника прикрутить к этому Турку какого-нибудь робота (вроде программы для распознавания речи, автоматического перевода и т.п.). Наверное, не получится всё же. Все равно придётся редактировать вручную.
Edited Date: 2015-06-08 11:04 am (UTC)

Date: 2015-06-08 11:19 am (UTC)
From: [identity profile] gaz-v-pol.livejournal.com
1. Я когда-то, лет 15 назад, подавал объявления в газету "Из рук в руки" по телефону. И еще много лет назад поразился -- предполагал, что нужно будет, как на диктанте, несколько раз одно и то же говорить. Но оказалось что нет, в большинстве случаев, если хорошо слышно, то достаточно один раз все сказать в обычном темпе, разве что нарочно хорошо проговаривая слова -- и девушка уже все успела набрать, и зачитывает мне обратно (как правило, полностью верно).

Если вдруг кто-то наловчился печатать на компьютере быстрее, чем обычная речь человека, он может ставить mp3-файл с увеличенной скоростью (т.е. в среднем обрабатывать минуту речи менее, чем за минуту своего труда). Не знаю, насколько это реально.


2. Люди могут заниматься какой-то деятельностью не столько ради денег, сколько ради ощущения нужности, что ли. Я и сам иногда на математические вопросы неизвестных людей из интернета отвечаю -- тратя на это много времени (не ради денег). Конечно, выглядит странным, что кто-то может добровольно переводить лекцию по математике с голоса в текст. Но кто знает, люди всякие бывают, моя жена тоже долго не могла поверить, что можно нужную неизвестно кому математическую задачу решать бесплатно в выходной день.

Date: 2015-06-08 04:12 pm (UTC)
From: [identity profile] affidavid.livejournal.com
Спасибо огромное, теперь я понял, как составляются экзаменационные задания.

Date: 2015-06-09 08:15 am (UTC)
From: [identity profile] dmpogo.livejournal.com
Я думаю что если бы вы сразу заказали написать лекцию, обошлось бы не слишком дороже :)

December 2025

S M T W T F S
  123 4 56
78 9 10 11 1213
1415 1617181920
21 22 23 24 2526 27
28293031   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Dec. 29th, 2025 12:19 pm
Powered by Dreamwidth Studios