Идентификация человека не должна привлекать человеческих ресурсов :)
Когда я поставил подтверждение регистрации " с проверкой администратором", то начал получать
пару сотен писем на свой ящик
в минуту (от чего gmail посчитал
postmaster@velo-kursk.ru спамером и забанил его кстати не только у меня).
Основная проблема сейчас кроется в смешанном подходе к взлому защиты от рекламных ботов.
Борьба алгоритмов рисования капчи и алгоритмов их распознавания уже вышла на уровень специализированных научных статей (именно по капчам, а не просто распознаванию образов).
А статическую защиту ломает реальный человек на подработках, внося в смаперскую базу ответы за например 100 руб/ресурс. Сейчас появились совсем суровые предложения, когда любые самые изощренные способы проверки ломает реальный человек (за рубль/успешная попытка, например при написании каждого сообщения, отправки SMS и т.п.).
На эту тему несколько лет назад у моих коллег из другого региона был интересный опыт: в одной большой колонии заключенные занимались рекламными SMS-рассылками (причем именно рекламой, а не например разводами, в виду разной меры административной ответственности) вручную набирая смски с помощью Т9 с древних нокий и сименсов в объемах более 15 тыс. сообщений/час. Организовано было на широкую ногу: в ротации было более трех сотен телефонов (~треть из которых постоянно находилась на подзарядке) и более семи тысяч (!) сим-карт (купленных зачастую на реальные данные заключенного). У них была целая служба "на воле", которая занималась приобретением старых дешёвых телефонов и новых симкарт в разных точках города, было выверено время ротации, был собственный бумажный биллинг (после рассылки - сжечь :) и довольно навороченный генератор псевдослучайного списка рассылки (с графовой моделью весов разных абонентов-получателей в зависимости от темы рассылки) на основе обратной связи от заказчиков.
Со стороны оператора нереально было отследить этот спам (громадное множество разных людей с разных телефонов разово и достаточно случайно по времени посылают по одной смске другим разным людям). Нужно отметить, что пассивность абонентов по заявлению о факте получения спама (обычно это пересылка смс на специальный бесплатный номер оператора... а вы когда последний раз жаловались на спам-смс?) играет решающую роль в отсутствии данных для анализа источника рассылки.
Бизнес ширился и найти помогло только случайное выскакивание аварий на железе контроллера базовых станций о временной перегрузке сигнальных каналов по нескольким конкретным сотам (а-ля локальный Новый Год :), после чего уже подбили статистику смсок относительно географии расположения БС и офигели - одна колония (через несколько рядом стоящих городских БС) создавала непрерывный поток смс-трафика, по объему сравнимый с тем, что создают жители небольшого города. И эта схема работала никем не обнаруженная пару лет!
В процессе расследования накрыли как руководителей этого бизнеса (причем там были очень технически подкованные люди, использующие PGP для переписки, анонимные инет-кошельки для оплаты и хитрый способ вывода денег), так и крышующих их сотрудников охраны колонии.
Но сам факт использования реальных человеческих ресурсов в таких масштабах впечатляет. Представьте себе, что может миллион-другой китайцев за чашку риса даже не зная русских букв? ;)
Спамерская реклама - это бизнес, который вполне адекватно инвестирует деньги как науку, так и в простой человеческий ресурс (что порой, более эффективно).
Бороться с этим бизнесом лично (проверяя каждое сообщение/нового пользователя) я не хочу. Хочу автоматическую систему, более-менее устойчивую к реальным спамерам.
Хороший пример: для регистрации на одном из форумов по электронике предлагается составить и решить систему уравнений Кирхгофа для случайно предложенной электрической схемы, в которой характеристики элементов так же случайны. Реальный человек-спамер тоже может ломать такую защиту, но для этого ему нужны базовые знания в электротехнике и некоторое время (2-3 минуты подумать) на верное решение каждого конкретного случая.
Предлагаю конкурс на лучший велосипедный вопрос/решение подобного рода, которое имело бы случайные входные параметры (и единственное решение для них), было бы узкоспециализировано, но доступно новичкам и не занимало бы много времени.