Мельницы богов: как технологии обработки персональных данных перевернули мир
632
просмотров
Чтобы контролировать граждан, государство стремится узнать о них как можно больше и развивает технологии для сбора и обработки этих данных. Так, еще в XIX веке перепись населения потребовала совершенно новых технических достижений.
Табулятор Холлерита в Бюро переписи населения. Около 1900 года

Юная Кейт Шерман Биллингс не могла сдержать улыбку, глядя на своего спутника. Молодой человек очень хотел произвести на девушку впечатление, но сегодня ему явно не везло. В клубе, куда они пришли на вечеринку, проводилась лотерея, и Герман скупил все билеты, кроме одного, который, как оказалось, и был выигрышным. Тронутая усилиями юноши, Кейт пригласила его домой на ужин.

Воздыхатель девушки работал вместе с ее отцом Джоном Шоу Биллингсом в государственном Бюро переписи населения. Мистер Биллингс был начальником отдела, а Герман Холлерит — простым статистиком. За ужином старший коллега посетовал, что каждые десять лет, когда проводится перепись населения США, сотрудники бюро едва справляются с огромными массивами информации.

— Должна существовать машина для выполнения чисто механической работы по составлению таблиц численности населения и тому подобной статистики, — глубокомысленно изрек мистер Биллингс. И посоветовал юноше обратить внимание на... ткацкие станки.

Этот разговор изменил жизнь не только Холлерита, но и всего человечества.

Море информации

Еще отцы-основатели США записали в Конституции: нужно точно знать количество граждан, поскольку от этого зависит число мандатов от каждого штата в палате представителей конгресса и в коллегии выборщиков. С 1790 года переписи проводились каждые десять лет, но население увеличивалось так быстро (за одно столетие приросло в 16 раз!), что статистики попросту не успевали обрабатывать информацию. Помимо численности правительство интересовали точные данные по рождаемости, смертности, семейному положению и расовой принадлежности жителей страны. А также кто где работает, сколько в стране предприятий и какой специализации, сколько налоговых должников, посетителей библиотек, учащихся колледжей, академий и школ и еще многое другое.

Герман Холлерит

Переписчики стучались в дома, задавали жителям вопросы и на каждого заполняли по одному бланку. Затем эти бланки стекались в центральный офис Бюро переписи в Вашингтоне. В дело вступали аналитики, которые готовили сводные ведомости в виде таблиц. Пол, раса и место рождения американцев сопоставлялись с их грамотностью, родом занятий и другими характеристиками. Каждый раз, когда требовалось составить какую-либо новую ведомость, клерки заново просматривали все десятки миллионов бланков. Процесс был чрезвычайно медленным и дорогостоящим, нередко случались ошибки.

Инженер Герман Холлерит, выходец из семьи немецких иммигрантов, поступил на работу в бюро незадолго до переписи 1880 года. Работа по составлению таблиц и анализу данных после ее завершения обещала затянуться на несколько лет. Чиновники нервничали и искали технические решения. Высокопоставленный сотрудник бюро Чарлз Ситон предложил простое устройство: ящик с бумажными лентами на катушках; на лентах операторы вручную ставили отметки о наличии того или иного признака у опрошенных. Но изобретение Ситона упростило задачу ненамного. Обработка данных переписи 1880 года продлилась почти до старта следующей. Все понимали, что перепись 1890-го потребует еще больше времени и денег, и Холлерит тоже искал выход из положения. Решение наметилось после упомянутой беседы с Джоном Биллингсом в августе 1881 года. Тот для наглядности сослался на принципы устройства ткацкого станка Жаккара, и эта мысль крепко засела в мозгу Холлерита.

Все дело в дырах

Пока в самом начале XIX века француз Жозеф Мари Жаккар не усовершенствовал ткацкий станок, изготавливать материи со сложными узорами было трудно. Работник-дергальщик забирался внутрь конструкции и по команде мастера вручную поднимал или опускал отдельные нити основы, которых иногда были сотни. Длительный процесс требовал постоянного внимания, неизбежно случались ошибки. Долго и сложно было и переоснащать станок для изготовления ткани с другим орнаментом.

Ткацкий станок Жаккара

Еще до Жаккара изобретатели пытались применить на станках твердые пластины с отверстиями (позже названные перфокартами), но именно он сконструировал наиболее эффективное рабочее устройство. Количество и расположение дыр на пластинах определяло рисунок на изготавливаемой ткани. Карты подавались в считывающее устройство станка одной длинной лентой. Чтобы перейти к новому рисунку, оператор просто менял ленту перфокарт. Станок невероятно облегчил труд ткачей: управиться с ним мог даже ребенок-подмастерье. В 1805 году мастерскую новатора в Лионе посетил сам император Наполеон и щедро наградил Жаккара. Изобретение ткача предвосхитило устройство первых компьютеров. В станках, как и в первых программируемых ЭВМ, данные вводились с помощью перфокарт — по сути, носителей двоичного кода (есть отверстие — нет отверстия).

В середине XIX века ценную идею позаимствовал английский математик Чарлз Бэббидж, задавшийся целью построить машину для арифметических вычислений. «Аналитическая машина» Бэббиджа, которую он так и не закончил, выглядела как набор множества зубчатых колес. Она должна была состоять из четырех частей: «мельницы» (устройства для выполнения арифметических действий), «склада» (для хранения результатов вычислений, то есть памяти), устройства, задающего машине последовательность операций, и устройства ввода и вывода информации. Колеса «мельницы» и «склада» могли останавливаться в одном из десяти положений и фиксировать таким образом одну из десяти цифр.

Часть «мельницы» из незаконченной «аналитической машины» Чарлза Бэббиджа

Данные в «аналитическую машину» должны были вводиться посредством перфокарт, которых было два вида. С помощью маленьких она переключалась в режимы сложения, вычитания, умножения, деления. Большие применялись для переноса чисел с «мельницы» на «склад» и обратно. «Использование перфокарт... означало, что в машину может быть введено неограниченное количество инструкций. Кроме того, при таком подходе последовательность задач можно было менять, в результате чего стало легче сконструировать машину общего назначения, которая была бы и универсальной, и перепрограммируемой», — пишет биограф Бэббиджа Уолтер Айзексон. Современные компьютеры во многом унаследовали архитектуру «аналитической машины». Когда спустя 70 с лишним лет после смерти математика компания IBM выпустила первый «настоящий» программируемый компьютер Mark I, его назвали «осуществленной мечтой Бэббиджа». Создатель Mark I Говард Эйкен не скрывал, что вдохновлялся работами изобретателя.

Вычислительная машина компании IBM 1950-х годов, работающая на перфокартах

Предок ЭВМ

Обдумывая изобретение, Холлерит изучал наработки Жаккара и Бэббиджа, а кроме того, «подглядел» важную идею в поезде. Билеты были безымянными, но кондукторы пробивали в них дырки в определенных местах, отмечая пол, цвет волос и глаз пассажира, чтобы бродяги не крали чужие проездные документы. И Холлерита осенило: вот как должны быть устроены перфокарты в его изобретении!

С 1882 года инженер конструировал свою табулирующую машину, или табулятор (от англ. tabulation — «составление таблиц»). Его изобретение с виду напоминало бюро и работало от электрических батарей. На панели над столом рядами располагались электромеханические счетчики. На столе находилось устройство, которое считывало данные с перфокарт и передавало их собственно на табулятор. Если табулятор использовался для обработки результатов переписи населения, то каждая перфокарта содержала данные об одном человеке (отверстия соответствовали возрасту, полу, расе, месту рождения, количеству детей, семейному положению и т. д.). Машина Холлерита оказалась способна не только хранить числовые данные, но и делить их на категории, устанавливать важные для статистических исследований комбинации разных признаков — например, пола с расой, возрастом, образованием и т. д.

Перфоратор-пантограф Холлерита. Начало XX века

Для ввода в табулятор информации Холлерит применял карточки со сторонами 3,25 и 7,375 дюйма (8,26 на 18,73 см), того же размера, что и доллары США 1887 года выпуска (Герман хранил перфокарты в коробках, которыми раньше пользовалось американское казначейство). После того как карта с набором характеристик проходила через воспринимающий пресс, информация с нее оседала на счетчиках. Затем оператор устанавливал новую карту, и процесс повторялся. Опытный сотрудник мог обрабатывать 80 перфокарт в минуту. Любую карту или разновидность карт можно было изолировать вручную или механически. Благодаря машинам Холлерита при обработке результатов больше не нужно было многократно сортировать бланки, как при ручных методах, и это свело к минимуму возможность ошибок.

Табуляторы были лишь частью оборудования машинно-счетной станции (МСС). В нее также входили контрольные устройства (для проверки, правильно ли пробиты карты) и сортировочные машины (которые делили карты на разные группы).

Холлерит вслед за Бэббиджем разработал основные принципы действия электронно-вычислительных машин. Они сводятся к тому, что компьютер должен выполнять операции над величинами, заданными в цифровой форме; обладать «памятью» — сохранять и исходную информацию, и результаты вычислений; «общаться» с человеком, то есть воспринимать от него данные и выдавать результаты их обработки; управлять процессом, то есть автоматически настраиваться на осуществление очередной операции в соответствии с программой. Но Бэббидж во многом остался теоретиком, а Холлерит сконструировал устройство, которое сразу же поступило в производство и стало применяться на практике.

Впереди всех

До переписи населения 1890 года Холлерит опробовал табулятор, в частности, в учреждениях здравоохранения.

Однако для того чтобы Бюро переписи населения взяло машину на вооружение, устройству Холлерита пришлось выдержать конкурс. Изобретатели Чарлз Ф. Пиджин и Уильям К. Хант предложили собственные вычислительные приборы. На состязании изобретение Холлерита выполнило задания в два-три раза быстрее, чем устройства соперников. Машины Холлерита приступили к работе в июле 1890 года, вскоре после завершения труда переписчиков. Итоговый результат подсчета — 62 622 250 человек — получили к 16 августа, всего через шесть недель. И если обработка данных переписи 1880-го заняла девять лет, то после 1890 года ее удалось выполнить менее чем за семь. «Этот прибор работает так же безошибочно, как и мельницы богов, но кладет их на лопатки по части скорости», — писал о табуляторе журнал Electrical Engineer, имея в виду известный с античных времен афоризм: «Мельницы богов мелют медленно, но неумолимо».

А ЧТО У НАС

 «Слишком много разума»

В первой половине XIX века в Санкт-Петербурге жил и работал чиновник статистического управления Министерства внутренних дел Семен Корсаков. Он увлекся конструированием механических устройств, которые управлялись с помощью перфокарт. Изобретения должны были помочь быстро искать, сравнивать и классифицировать необходимую информацию. Чиновник представил их на суд Императорской Академии наук, однако оценочная комиссия их отвергла. «Г-н Корсаков потратил слишком много разума на то, чтобы научить других обходиться без разума», — гласил вердикт. Изобретения «русского Бэббиджа» были забыты, заново их открыли в архивах лишь сто лет спустя.

Всех посчитать

Первая и последняя в истории Российской империи всеобщая перепись населения состоялась в 1897 году. Ее главным инициатором был вице-председатель Императорского Русского географического общества Петр Петрович Семенов-Тян-Шанский — один из руководителей правительственной статистики, с 1875 года — председатель Статистического совета при Министерстве внутренних дел. До этого в России переписи проводили нерегулярно, в разных городах и губерниях в разное время, и в распоряжении государственных ведомств были неточные данные. Семенов-Тян-Шанский убедил власти, что необходимо провести централизованную перепись по состоянию на единый день по всей империи. Этим днем было назначено 28 января (ст. ст.) 1897 года. В работе участвовало до 150 тысяч счетчиков, которые заполнили 30 миллионов бланков. Обработка проводилась с помощью машин Холлерита. Численность населения Российской империи на 1897 год составляла 125 640 021 человек.

***

В этом же, 1890 году табуляторы применили при переписи населения в Австро-Венгрии, в 1891-м — в Канаде и Норвегии, в 1896-м — во Франции. Машинами Холлерита заинтересовался и частный бизнес: универмаги, железнодорожные, сталелитейные компании...

К началу 1900-х годов основанная Холлеритом фирма Tabulating Machine Company имела больше клиентов, чем могла обслуживать. В 1911-м фирма вошла в состав Computing Tabulating Recording (CTR), позднее сменившей название на International Business Machines. Десятилетиями IBM определяла развитие вычислительной техники. Холлерита же наряду с Бэббиджем называют одним из «дедушек» современного компьютера.

Ваша реакция?


Мы думаем Вам понравится