Энциклопедия символов «Юникодия»: итоги года
Я всё ещё продолжаю писать открытую энциклопедию Юникода и замену стандартной Таблице символов. И даже провёл новогоднюю ночь за подтягиванием мелких глючков, обнаруженных за написанием этой заметки. Качать тут.
Все подводят итоги года — и я подведу.
Тизер: рассказ про венгерские руны
Вот таких текстов в Юникодии больше сотни килобайт.
• Тип: алфавитная — как кириллица
• Направление: ←
• Языки: венгерский
• Появилась: X век (возможно, раньше)
• Состояние: историческая, не требует расшифровки (как глаголица)Неизвестно, как старовенгерские руны связаны с тюркскими: то ли произошли от них, то ли сестринские письменности.
Иштван I, первый король Венгрии, объединил венгерские племена, обратил в христианство и около 1000 перешёл на латиницу, но руны продолжают использоваться, постепенно угасая. Последние надписи датируются ≈1800.
С XVII века началось изучение, около 1900 проведена основная работа и даже придумали руны для недостающих звуков венгерского. Венгры гордятся рунами и иногда дублируют ими надписи. Но мало кто умеет читать руны: в 2017 шутники заменили знак города Эрд (Érd) на «Szia» (привет, оба слова длиной 3 руны), и заметили это через месяц.
Полный Юникод 17 без тофу (лето)
Я интегрировал уже пять версий Юникода. Но только в этой, семнадцатой, мне активно предлагали свои наработки. А конкретно — тангутский и арабские лигатуры. Так что закрыл все тофу ещё до сентября, когда Юникод выходит в выпуск.
Нет, в позиции 18CFF не тофу, а символ малого киданьского письма «иероглиф неразборчив». Обычно с этой целью используют какую-то геометрию, но именно в киданьском и египетском есть сложное форматирование, потому разунифицировали.
Первая версия компилятора ККЯ (весна)
GlyphWiki — очень интересная платформа. Она описывает иероглифы вот таким простеньким языком.
За этим языком стоит очень сложный визуализатор, написанный на JavaScript — и я нашёл, запустил и интегрировал продвинутую версию этого визуализатора, которая строит иероглифы из кривых (а не отрезков). Портация визуализатора на Си++ идёт с переменным успехом.
До этого я качал с GlyphWiki SVG-файлы из отрезков, но полуавтоматическая доводка этого дела до рабочего шрифта была тем ещё делом.
Чтобы всё заработало, мне помогли наработки по совсем другой письменности…
Действующий египетский шрифт (продолжается работа)
Шрифт полусвободный, единственное ограничение (не моё) — запрещено применение в альтернативных иероглифических процессорах. Поскольку Юникодия таковым не является, для меня это не важно — зато очень красив.
Шрифт теперь годен вне Юникодии, потому что имеет очень приличное покрытие:
Египетские иероглифы — все 1072.
Форматирующие символы для египетских иероглифов — все 38, но на уровне затычек.
Египетские иероглифы расширенные A — более 3450 из 3995. Штук пятьсот из них мои.
Вот так выглядит имя Тутанхамон в моём шрифте.
На самом деле почти никто не поддерживает сложное форматирование — потому что оно плохо вписывается в возможности шрифтовой системы OpenType. Египтологи ждут поддержку WebAssembly-скриптов в шрифтах.
Турецкая локализация (лето)
Объявился турок и сделал полный перевод.
Улучшенная навигация (лето)
Решились два вопроса.
Теперь любой рассказ может ссылаться на любой символ. Очень красиво вышло в описании иероглифов.
Юникодия — это запутанный гипертекст, и если всплывающее окно закрылось или кривая вас увела непонятно куда,— ничего страшного. Всегда можно вернуться по цепочке назад.
Windows 11 и тесные экраны (осень-зима)
Раз уж на моём дополнительном ноутбуке лицензионная 10 Pro с бесплатным апгрейдом до 11, написал серьёзные алгоритмы поддержки всплывающих окошек на тесных экранах.
В них запрограммировано:
избегать окон выше 3:4;
избегать окон выше 650 аппаратно-независимых пикселей (анп);
самое узкое окно — 450 анп, но если удаётся ещё сузить, не поднимая высоты,— сделать это;
если мы сужаем окно, а оно не становится выше,— брать не самое узкое, чтобы абзацы не уплотнялись в кирпич;
делать окно шире 850 анп в крайних случаях, если по-другому никак не вместить в экран.
Потери года
Брошена поддержка японского языка: японец ухаживает за серьёзно больной женой.
Из его локализации я понял, что японский язык имеет довольно сложные методы записи приблизительных чисел (чего-то вроде «130 тысяч»). И я даже запрограммировал эту поддержку, но не могу достучаться, чтобы он проверил. О допереводе я даже не заикаюсь.
Текст гласит: 3 млн = 300·10.000 владеющих лаосским языком как родным в Лаосе, и 4 млн как вторым; ещё >20 млн в Таиланде пользуются тайским письмом.
Умер спец по китайским иероглифам, с которым я советовался.
Я с ним советовался, ловил ошибки в его шрифте BabelStone Han — и вдруг он не вышел на связь. Вскоре я узнал страшную весть: сердечный приступ. Скорее всего, шрифт придётся бросить.
А пока — с Новым годом!
































































































