Han Xin Code
Han Xin Code (汉信码) — двумерный матричный код стандарта ISO/IEC 20830, разработанный в КНР для компактного кодирования китайских иероглифов по таблице GB18030.
Определение Han Xin Code
Han Xin Code (汉信码, «Китайский код») — двумерный матричный штрих-код, описанный международным стандартом ISO/IEC 20830. Разработан в Китае под эгидой Article Numbering Center of China (ANCC) и впервые опубликован как национальный стандарт GB/T 21049 в 2007 году. Главная задача кода — кодировать китайские иероглифы по таблице GB18030 компактнее, чем это делает обычный QR-код, который рассчитан в первую очередь на латиницу и Kanji.
Внешне Han Xin Code похож на QR: квадратная матрица из чёрных и белых модулей, поисковые метки по углам и зоны выравнивания. Но кодирование иероглифов устроено иначе — символ GB18030 упаковывается напрямую, без двойного перекодирования в байты, поэтому на той же площади помещается заметно больше китайского текста. Максимальная ёмкость — около 7827 цифр или 4350 иероглифов.
Как работает Han Xin Code
Код собирается из квадратных версий — от 23×23 модулей (Version 1) до 189×189 модулей (Version 84). В каждом углу расположена поисковая метка (Finder Pattern), задающая ориентацию и позволяющая сканеру быстро локализовать символ под любым углом поворота. Между метками идут зоны выравнивания и область данных. Структура сознательно сделана близкой к QR, чтобы производители сканеров могли добавить поддержку формата без переделки оптики.
За устойчивость к повреждениям отвечает коррекция ошибок по алгоритму Рида — Соломона с четырьмя уровнями (L1–L4): чем выше уровень, тем больше байтов резервируется на восстановление и тем большую долю стёртой или закрашенной поверхности можно прочитать. Ключевая особенность — режим кодирования, оптимизированный под GB18030: один иероглиф занимает меньше бит, чем при кодировании того же знака в UTF-8 внутри QR-кода.
Параметры Han Xin Code
| Параметр | Значение |
|---|---|
| Стандарт | ISO/IEC 20830 (нац. GB/T 21049) |
| Тип | Двумерный матричный |
| Размеры версий | 23×23 … 189×189 модулей |
| Максимум цифр | ~7827 |
| Максимум иероглифов | ~4350 |
| Кодировка текста | GB18030 (полный диапазон) |
| Коррекция ошибок | Reed-Solomon, 4 уровня (L1–L4) |
| Поисковые метки | Четыре угловых |
Где применяется Han Xin Code
Han Xin Code распространён прежде всего на внутреннем рынке КНР, где плотность кодирования иероглифов даёт реальную экономию места на этикетке. Основные сценарии:
- Маркировка товаров — упаковка с длинными названиями и составом на китайском языке.
- Логистика и документооборот — накладные, складские этикетки, отслеживание партий.
- Платежи — код использовался в китайских платёжных и идентификационных схемах как национальная альтернатива иностранным форматам.
- Государственные и отраслевые документы — там, где требуется хранить кириллицеподобные объёмы текста, но на иероглифике.
За пределами Китая формат встречается редко: латинский и цифровой текст он кодирует примерно как QR, поэтому преимущество проявляется только на иероглифах. Сгенерировать такой код или подобрать подходящий формат под свою задачу удобно в генераторе штрих-кодов, где собраны и линейные, и матричные символики.
Связанные концепции
- QR-код — ближайший родственник по структуре, японский стандарт ISO/IEC 18004 с тремя угловыми метками.
- Data Matrix — компактный 2D-код для мелкой маркировки и системы «Честный знак».
- Aztec Code — матричный код с центральной меткой, не требующий тихой зоны.
Если нужен максимально компактный код для маленькой упаковки без китайского текста, чаще выбирают Data Matrix — он экономнее QR на коротких строках.
Частые вопросы
Чем Han Xin Code отличается от QR-кода?
Структурно они близки: квадратная матрица, поисковые метки в углах, коррекция Рида — Соломона. Разница в кодировании текста. Han Xin Code напрямую упаковывает символы GB18030, поэтому китайские иероглифы занимают меньше места, чем те же знаки в QR-коде. На латинице и цифрах преимущества почти нет, поэтому за пределами КНР QR остаётся стандартом де-факто.
Сколько данных вмещает Han Xin Code?
Максимальная ёмкость старшей версии (189×189 модулей) — порядка 7827 цифр или около 4350 китайских иероглифов. Точный объём зависит от выбранного уровня коррекции ошибок: чем выше уровень L1–L4, тем больше площади резервируется под восстановление и тем меньше остаётся под полезные данные. Для коротких строк используют младшие версии начиная с 23×23 модулей.
Это китайский стандарт или международный?
И тот, и другой. Изначально Han Xin Code приняли в Китае как национальный стандарт GB/T 21049 в 2007 году, разработчик — Article Numbering Center of China. Позже формат получил статус международного стандарта ISO/IEC 20830, что открыло путь к поддержке в сторонних библиотеках и сканерах. На практике массово он применяется внутри КНР.
Какая кодировка используется для иероглифов?
Han Xin Code опирается на GB18030 — действующий национальный стандарт кодировки символов КНР, охватывающий весь Unicode и упрощённые иероглифы. Именно прямая работа с GB18030 даёт выигрыш в плотности: знак кодируется без промежуточного перевода в UTF-8, как это происходит в QR-коде. Поэтому формат особенно эффективен на текстах, целиком состоящих из иероглифов.
Можно ли отсканировать Han Xin Code обычным смартфоном?
Не всегда. Большинство встроенных камер и приложений по умолчанию распознают QR-код и Data Matrix, но не Han Xin Code. Для надёжного чтения нужен сканер или приложение с явной поддержкой ISO/IEC 20830. В Китае такая поддержка встречается часто, за рубежом — реже, поэтому формат обычно выбирают для замкнутых систем, где парк сканеров контролируется.