История изобретения клавиатуры для ввода тысяч китайских иероглифов
Письменный китайский язык включает более 80 тысяч иероглифов, поэтому серийный выпуск клавиатур, в которых каждая клавиша соответствует одному иероглифу, не представляется возможным. Потребовалось несколько десятилетий инженерных поисков, чтобы создать компактные клавиатуры для китайского языка, которые по конструкции ничем не отличаются от моделей для других языков. Этой теме посвящена книга «Китайский компьютер: глобальная история информационной эпохи» (2024), автором которой является Thomas Mullaney, профессор истории Стэнфордской школы гуманитарных наук и один из директоров компании SILICON.
«Это не история о том, как китайские инженеры решали национальную лингвистическую загадку. Скорее, это история инженеров всего мира, которые столкнулись с чрезвычайно сложной проблемой. На первый взгляд китайские иероглифы выглядят одинаково на бумаге и на экране, но на самом деле имеются определенные различия. Инженеры, приложившие усилия к созданию клавиатуры на китайском языке, нашли способ приобщить пятую часть человечества к эпохе цифровых вычислений и при этом полностью изменили технологию», – отмечает Thomas.
Предыдущая книга автора, изданная в 2018 году, называлась «Китайская пишущая машинка». В ней повествовалось о решении сложной инженерной задачи по созданию устройства для печати китайского текста. Западная разработка, вмещавшая около 80 тысяч символов, была оптимизирована для китайского алфавита и отличалась компактностью, поэтому машинкой можно было управлять двумя руками. Среди недостатков, обнаруженных в конструкции, стоит выделить каретку, выдвигавшуюся вперед после каждого нажатия клавиши, что делало непрактичным процесс создания символов мазок за мазком. Возникшие проблемы побудили инженеров к модернизации электрических пишущих машинок, которые могли приостанавливать движение каретки или предлагать пользователям выбрать следующий символ с помощью длинных комбинаций клавиш.
В 1959 году инженер Массачусетского технологического института Samuel Caldwell выпустил прототип первого компьютера под названием Sinotype, оптимизированного для китайского языка. Он планировал, что пользователи новой машины будут вводить мазки каждого символа. Оригинальное изобретение совпало с заявлением коммунистического лидера Мао Цзэдуна о том, что Китаю необходимо перейти на латинский алфавит, чтобы идти в ногу со временем. В течение трех десятилетий китайские, тайваньские, японские и американские инженеры предприняли немало попыток совместить традиционную китайскую письменность с привычными модификациями клавиатур. Их неординарные решения развивались вместе с компьютерными технологиями и основывались на методах, которые сегодня используются для взаимодействия с компьютерами.
Samuel применил инженерный подход и составил таблицы уникальных, а также наиболее часто встречающихся штрихов в иероглифах кантонского, мандаринского и некоторых других диалектов. В результате было сделано важное открытие: вместо серии нажатий клавиш для ввода символа можно использовать принцип адресного каталога, определяя местоположение каждого символа в памяти компьютера.
На протяжении тысячелетий люди составляли слова, вырезая, записывая или печатая их. Но для ввода китайского языка с помощью клавиатуры требовался несколько иной подход, при котором оператор сигнализирует устройству, какой символ или слово следует извлечь из его памяти. «Умение» компьютеров предсказывать вводимые символы означало переход на новый уровень, включающий такие функции, как автозаполнение, предиктивный текст и искусственный интеллект. Конструкция клавиатуры была не единственным препятствием, которое пришлось преодолеть на пути к цифровому формату ввода. В 1970-1980-е годы компьютер Apple II использовал лишь 20% из 256 килобайт памяти, необходимой для хранения 8 тысяч наиболее распространенных китайских иероглифов. Со временем объем обрабатываемых данных увеличился, а печатающие головки и драйверы подверглись доработке с целью повышения распознавания китайских иероглифов.
На процесс адаптации и цифровизации китайских языков повлияли не только технические, но и социально-политические факторы. Ярким примером является пиньинь. В 1950-х годах, когда Мао призывал отказаться от иероглифов, а Вьетнам начал внедрять аналогичную практику в эпоху пишущих машинок, китайские лингвисты разработали систему, позволяющую записывать транскрипцию китайского текста латинскими буквами. Но, как утверждает Thomas Mullaney, пиньинь имел ряд недостатков по сравнению с вводом мандаринского языка с помощью клавиатуры. Прежде всего, для его использования требовалось длительное изучение латинского алфавита, которому препятствовала культурная революция в Китае. По мере стабилизации политической и экономической ситуации в 1980-1990-х годах пиньинь как способ ввода обрел новую жизнь.
Сегодня большинство текстовых редакторов и процессоров, поддерживающих китайский язык, используют ту или иную форму пиньинь для ввода символов. Когда пользователь печатает текст, устройство начинает предлагать возможные сочетания символов. Thomas подробно описывает, как это достижение привело компьютерные технологии к современным алгоритмам предиктивного ввода текста и искусственного интеллекта. «К 1990-м годам китайский предиктивный текст в сочетании с вводом пиньинь фактически обеспечил предсказание следующего иероглифа и даже целых фрагментов, состоящих из нескольких иероглифов. Таким образом, алгоритмические требования письменного китайского языка повлияли на развитие компьютерных технологий, что говорит о безоговорочном успехе многолетних экспериментов», – считает Thomas.
По материалам news.stanford.edu