Китайский иероглиф — это символ, целью которого служит запись китайского слова для его зрительного восприятия. Это договоренность, чтобы записывать слова, которые при устной речи бы не сохранились ни в каком виде.
Иероглиф является только формой, которая записывает слово (его звучание и значение).
Теперь рассмотрим, каким образом иероглифы могут делать слова возможными к визуализации (речь будет идти отнюдь не о происхождении иероглифов, а о том, каким способом они передают то или иное слово).
Для классификации по этому критерию существует система «шести категорий» (六書), которая подробно описана в словаре «Объяснение простых и толкование сложных знаков» (說文解字 Шовэнь цзецзы) и делит иероглифы на 1. пиктограммы (象形), 2. указатели (指事), 3. составные идеограммы (會意), 4. фоноидеограммы (形聲), 5. видоизменённые (轉注) и 6. заимствованные (假借). Этот способ деления всех иероглифов на шесть категорий настолько прижился, что даже сейчас очень часто используется в массовой литературе.
Однако эти «шесть категорий» не являются результатом некоего исследования, которое показало, что все иероглифы можно разделить на шесть типов — оно является результатом того, что исследователи эпохи Хань (206 г. до н. э. — 220 г. н. э.) истолковали подобным образом соответствующее слово из канонических текстов. С самого начала эта система загоняла исследователей в рамки шести категорий, и к тому же имеет множество недочётов. В современной науке она не используется совсем.
В реальности же иероглифы имеют огромное множество типов строения, и границы между ними не всегда чёткие. Можно выделить три главных типа: 1. семантограммы, 2. фонетические заимствования и 3. фонограммы — они могут делиться на более мелкие подтипы.
В данной статье на картинках будут приводиться древние иероглифы, поскольку они более наглядны.
Семантограммы
Иероглиф является семантограммой, когда визуализирует только смысл слова, которое он передаёт, не опираясь на звучание.
Когда иероглиф прямо передаёт объект, который обозначает слово, то он является пиктограммой (отличается от «пиктограмм» из «шести категорий»). Например, поскольку слово {人} значит «человек», оно записывается изображением человека. (В фигурных скобках записывается конкретное слово: например, {人} в рамках современного языка обозначает «слово, читающееся как rén и значащее „человек“, которое сейчас обычно записывается как 人»).
Пиктограмм существует довольно много — обычно они изображают людей, части тела, растения, небесные тела, природные явления, животных, строения, инструменты, ландшафт и т.п. Это очень древний тип, новые иероглифы в котором практически не создаются начиная с эпохи Западной Чжоу (1045—770 гг. до н.э.).

Существуют также абстрактные пиктограммы — когда иероглиф изображает некое абстрактное понятие. Они тоже обычно относятся к самому древнему этапу письма, но иногда встречаются в течение всей его эволюции (ср. современные 凸 «выпуклый» или 丫 «развилка»).

Выделительные пиктограммы делают акцент на какой-то части, чтобы передать совершенно новое значение. В эту категорию часто входят иероглифы, записывающие части тела или действия, связанные с ними. Они также довольно древние и практически не создаются с поздних этапов древнего письма.

Все вышеперечисленные иероглифы являются простыми, их нельзя разбить на два и более элементов. Однако существуют также и сложные иероглифы.
Например, слово {獲} «ловить (добычу)» записывается через иероглиф, состоящий из птицы (隹) и руки (又).

Однако он именно что изображает ловлю птицы рукой, и его нельзя разбить на два элемента. Рука здесь изображена как инструмент, которым ловят птицу — иероглиф нельзя просто описать как «птица + рука», т.е. он состоит из графических элементов нежели чем семантических (см. далее). По этой причине их логично называть сложными пиктограммами. Они практически не создаются с поздних этапов древнего письма, но иногда их можно встретить и в современном (ср. 閂 «засов» или 灭 «тушить»).

От пиктограмм мы переходим к другому типу семантограмм — указательные иероглифы. Указательными элементами являются кружочки, точки или линии, показывающие на какую-то конкретную часть, которое обозначает слово, записываемое этим иероглифом. Они практически не создаются с поздних этапов древнего письма.

Наконец, переходим к составным семантограммам. Это семантограммы, состоящие из двух и более семантических элементов (семантиков), которые по отдельности значат что-то своё, и получившийся иероглиф сочетает эти значения. Они довольно редки в древнем письме, но всё чаще создаются позже (особенно часты в японско-корейской ветви современного китайского письма).

Конечно, есть некоторые иероглифы, которые являются непонятно чем — либо сложными пиктограммами, либо составными семантограммами. Здесь эта проблема рассматриваться не будет.
Фонетические заимствования
Представим, что у нас есть слово {錡} «зубчатый топор», записывающееся соответствующей пиктограммой. Также у нас есть слово {我} «я», но для которого сложно придумать какую-либо конкретную запись. Поскольку слова {錡} и {我} созвучны (так было в древнекитайском языке), мы можем взять иероглиф для слова {錡} и с помощью него фонетически записать слово {我}. Эта пиктограмма и дала современный иероглиф 我.

Все подобные примеры, когда иероглиф используется для записи этимологически несвязанного, но созвучного слова, называются фонетическим заимствованием. Они используются и по сей день — например, в играх слов, основанных на созвучии иероглифов, или особенно часто для записи слов других китайских языков, у которых нет устоявшейся орфографии.
Одной из главных причин появления фонетических заимствований является сложность визуализации некоторых слов — например, слов с абстрактными значениями. Другой причиной, по-видимому, можно считать тот факт, что люди могут ошибочно связывать два этимологически несвязанных слова, основываясь только на их созвучии (народная этимология). Это можно встретить и в наши дни — например, суеверия, завязанные на созвучии слов {四} «четыре» и {死} «смерть».
Фонограммы
Фонограммы — это составные иероглифы, содержащие фонетический элемент (фонетик).
Например, слово {道} «дорога» могло записываться иероглифами, состоящими из семантика 行 «дорога» и фонетиков 首 или 舀. Иероглифы 首 и 舀 передают слова {首} «голова» и {搯} «вытаскивать» соответственно — их значения никак не связаны со словом {道} «дорога» (в отличие от семантика 行), однако они имеют близкое звучание.

Фонограммы — это очень удобный способ создания новых иероглифов на основе идей уже имеющихся семантограмм и фонетических заимствований. С их появлением произошёл настоящий бум в создании новых символов — практически все существующие иероглифы (более 90%) относятся к этому типу.
Среди слов всегда будут синонимы, похожие значением, но различающиеся мелкими нюансами. Например, существует множество слов со значением «дорога»: {行}, {道}, {路}, {途}, {徑} и т.д. Записать их все одними лишь семантограммами — очень сложная задача. Точно так же и читающему будет сложно понять, какое слово имелось в виду, если все слова записать одним и тем же иероглифом.

Однако фонограммы позволяют нам легко передать все эти слова, добавив соответствующий фонетический элемент к семантическому.

Часто встречаются случаи, когда к уже существующей семантограмме добавляют фонетик для уточнения чтения. Например, слово {鷄} «петух» изначально писалось обычным изображением петуха. Позже к нему добавился фонетик 奚, созвучный слову {鷄}, а затем изображение петуха сменилось на обычную птицу 鳥, поскольку сохранять изначальный рисунок стало уже не нужно из-за наличия фонетика.

Тип иероглифа, к которому прибавляют дополнительный фонетик, может быть любым.

При фонетическом заимствовании один иероглиф может передавать целое множество созвучных слов — например, иероглиф для {錡} «зубчатый топор» может записывать слова {我} «я», {義} «нравственность», {儀} «этикет», {宜} «следует» и т.п. Какое конкретно слово записано иероглифом, нужно определять по контексту. Это легко может привести к проблеме, когда непонятно, в каком именно значении какое слово использовано, поскольку из-за семантических сдвигов и расширений одно и то же слово может иметь огромный спектр самых разных значений.
С этой проблемой нам помогают справиться фонограммы. С помощью добавления к одному фонетику различных семантиков мы можем разделить близко звучащие слова — например, добавив к фонетику 巠 семантики 行 «дорога», 艸 «трава» и 糸 «нить» мы можем получить иероглифы 徑 «дорога», 莖 «стебель» и 經 «продольная нить» соответственно.
По этой же причине существуют составные иероглифы, где к уже существующему иероглифу был добавлен семантик. Выше уже были показаны иероглифы для слова {道} «дорога», однако они также содержат дополнительный элемент 止 «нога» (он часто прибавлялся к элементу 行 / 彳, и в итоге их смешение дало современный элемент 辵 / 辶).

Для записи слова {來} «приходить» использовалось изображение колосьев пшеницы, поскольку слова {來} «приходить» и {麥} «пшеница» созвучны. Чтобы передать значение «приходить», к заимствованному иероглифу мог добавляться семантик 夊 (перевёрнутый 止 «нога»). Сначала оба этих иероглифа использовались взаимозаменяемо, но позже разделились в своём использовании — 來 остался как привычный способ записи {來} «приходить», а иероглиф с добавленным 夊 начал использоваться для записи {麥} «пшеница». Происходит дифференциация.

Существует и другой тип дифференциации — когда к иероглифу добавляют семантик, чтобы отделить заимствованное или расширенное значение иероглифа. Например, слово {暮} «закат» записывалось как 莫, т.е. изображением солнца между травой. Позже иероглиф 莫 стал записывать слово {莫} «нет», и тогда к иероглифу добавили семантик 日 «солнце», чтобы передать исходное значение, а исходный иероглиф взял на себя заимствованное.

Особенно большое количество иероглифов обратного типа — к ним семантик был добавлен для передачи заимствованного или расширенного значения. Почти все иероглифы, созданные после перехода письма в современное, относятся к этому типу.

Таким образом, фонограммы могут образовываться не только совмещением семантика и фонетика, но и добавлением семантика или фонетика к полноценному иероглифу.
Как и в примере с {道} «дорога», в качестве фонетика могут использоваться совершенно разные созвучные элементы; в качестве семантика точно так же могут использоваться разные синонимичные элементы — из-за всего этого фонограмм для записи одного слова может быть огромное множество (например, слово {袜} «чулки» имеет варианты записи 袜 帓 ? ? 襪 韈 韤 ?).
Украшающие элементы
Украшающие элементы (включая черты) — это части иероглифа, не несущие никакого значения или чтения, используемые либо для нарочитого украшения/усложнения иероглифа (отсюда их название), либо для дифференциации. Иероглиф без украшающей черты и тот же иероглиф с ней обычно используются взаимозаменяемо, но для украшающих элементов более часты случаи дифференциации, как в примере с 來 «приходить» и 麥 «пшеница» выше (см. далее).
Часто украшающие черты/точки добавляются сверху (если сверху иероглифа находится горизонтальная черта), по краям иероглифа-палки (в виде 八), пересекают прямую линию или заполняют пустоты. Иероглифы с украшениями можно найти и по сей день — например, в некоторых регионах иероглифы 人 «человек» или 文 «узор» могут писать с тремя чертами 彡, пересекающими их правую «ножку».

Самым частым украшающим элементом является 口, который не стоит путать с семантиком 口 «рот». Обычно украшающий 口 помещается снизу или внутри иероглифа (в последнем случае их может быть несколько). Помимо 口 существуют элементы вроде 寸 или 工.

Иероглифы, содержащие украшающие элементы, относятся к тому же типу строения, к которому относятся и без украшающих.
Дополнительно о дифференциации
Помимо дифференциации посредством добавления семантика и фонетика, существует также дифференциация посредством добавления украшающего элемента. В этих случаях дифференциация может происходить как по чтению (исходный и дифференцированный иероглиф близки по звучанию), так и по значению (исходный и дифференцированный иероглиф близки по значению).
С дифференциацией по чтению всё просто — иероглиф с украшающим элементом берёт чтение исходного иероглифа, но записывает другое слово. Эти иероглифы следует относить к фонограммам.

На раннем этапе письма некоторые иероглифы обладали поливалентностью (т.е. передавали несколько совершенно разных, но близких по значению слов). Это легло в основу некоторых ранних иероглифов, в которых украшающие элементы указывали на то, что иероглиф передаёт не то слово, которое он изображает, а связанное с ним по смыслу. Эти иероглифы следует относить к семантограммам.

Ещё один важный тип дифференциации — изменение графической формы иероглифа или его сокращение. Обычно он употребляется при записи очень частых (особенно грамматических) слов. Используется он только на основе созвучных слов. Эти иероглифы можно считать как особым типом семантограмм, так и особым типом фонетического заимствования. Они встречаются во всех этапах письма, включая современное (ср. 刁 «хитрый» от 刀 «нож»; 乒乓 «пинг-понг» от 兵 «солдат»; 茶 «чай» от 荼 «горький»; 着 «надевать» от 著 «произведение» от 箸 «палочки для еды» и т.п.).

Все вышеперечисленные типы дифференциации очень важны и хорошо известны современной науке.
Лигатуры
В древнем письме очень часто используются лигатуры — сочетания двух или более иероглифов, объединённые в один. Их следует читать как несколько слов — они обычно записывают сочетания чисел, количество предметов, имена, топонимы и т.п. Встречаются они ещё с самых ранних текстов, а начиная с Вёсен и Осеней (770—481 гг. до н.э.) очень часто помечаются символом =, который ещё с Западной Чжоу обычно обозначает повторение иероглифа. Современные иероглифы вроде 浬 «морская миля» (< 海里) тоже относятся к лигатурам.

Современные иероглифы 百 «сто», 千 «тысяча», 萬 «десять тысяч» происходят как раз из таких лигатур с фонетиком и иероглифом 一 «один». Изначально они передавали слова «одна сотня», «одна тысяча» и «один десяток тысяч».
Редкие типы иероглифов
Иногда иероглиф может состоять из двух одинаковых фонетиков. Конечно, их можно было бы отнести к фонограммам, но отсутствие семантика не позволяет этого сделать (не путать с иероглифами вроде 在, в котором фонетик хоть и добавляется к фонетическому заимствованию, но оно там используется как семантик). Они характерны для древнего письма. Среди распространённых можно выделить такие иероглифы как 友 «друг» (два 又), 比 «сравнивать» (два 匕), 兩 «два» (два 丙) — в них повторение фонетика передаёт идею «два; ставить в ряд».
Некоторые фонограммы можно рассматривать как фонограммы с заменённым семантиком. Например, 賑 «помогать (материально)» можно считать происходящим от 振 «помогать» с изменением семантика на 貝 «ракушка (каури)». Конечно, их можно считать и обычными фонограммами.
Более современный и уникальный тип — сочетание элементов по типу фаньце (когда берётся инициаль от одного элемента и финаль от другого). Такие символы создавались для более точной передачи иностранных звуков, не встречавшихся в китайском языке. Например, иероглифы ? (инициаль 名 + финаль 養) и ? (инициаль 亭 + финаль 夜) из буддийских текстов.
Ещё один тип, свойственный современному письму, часто встречается в средневековых текстах при записи двусложных слов (особенно разговорных) — ассимиляция элемента. Примеров подобного образования довольно много, и обычно ассимилировались семантики — например, {敦煌} «Дуньхуан» могло писаться как 燉煌, т.е. иероглиф 敦 перенимает себе левый элемент от 煌. Хоть самостоятельный иероглиф 燉 уже существует (записывает слова вроде «тёплый» или «варить»), он не будет равен иероглифу 燉 из 燉煌, поскольку первый состоит из семантика 火 «огонь» и фонетика 敦, а второй состоит из фонетика 敦 и ассимиляционного элемента 火. Есть и примеры, когда берётся не семантик — например, слово {鳳凰} «феникс» изначально писалось как 鳳皇, но второй иероглиф позже превратился в 凰 через ассимиляцию с 鳳. В иероглифе 鳳 элемент 凡 является фонетиком, но в 凰 он не значит ничего.
Иногда подобные иероглифы сочетают в себе семантики, т.е. одновременно передают слияние смысла и звучания. Они относительно часто встречаются в разных китайских языках и диалектах. Например, иероглиф 甭 «не надо» (из 不 «не» и 用 «надо») или «диалектный» иероглиф 㬟 «никогда» (из 勿 «не» и 曾 «[указывает на прошлое]»). Сюда же входят некоторые «химические» иероглифы вроде 羥 «гидроксил» (вместо 氫氧基) или 羰 «карбонил» (вместо 碳氧基). Ещё несколько уникальных примеров этого типа — иероглифы для изотопов водорода 氕 «протий», 氘 «дейтерий» и 氚 «тритий», в которых фонетиками и одновременно абстрактными пиктограммами выступают 丿(= 撇 «откидная влево черта»), 刂 (вариант 刀 «нож») и 川 «река» соответственно.
Иногда встречаются заимствования из других письменностей, стилизованные под китайское. Например, иероглиф 卍 «свастика» пришёл из Индии вместе с буддизмом. Иероглиф 歹(?) «плохой» скорее всего является заимствованием буквы ꡊ /ta/ из монгольского квадратного письма (не путать с омографичным 歹, который является сокращением от 死 «умирать»). Такие случаи до XX века единичны и почти не встречаются за пределами сборников или словарей.
В Японии со сравнительно давних времён используются иероглифы, которые содержат в себе символы японских азбук (как полностью состоят из них, так и используют в качестве фонетиков). Точно так же и в Корее издавна использовались иероглифы, содержащие в себе символы корейских азбук (хангыль или кугёль) в качестве вспомогательного элемента. В последние века в разных регионах появились иероглифы, основанные на латинских буквах или содержащие их в качестве фонетиков. Есть и другие примеры с другими символами, но это не тема нынешней статьи.

Аллографы и омографы
При рассказе об устройстве иероглифов также важно затронуть тему аллографов и омографов.
Аллографы — это иероглифы, имеющие одинаковое чтение и значение, но разные формы. В строгом смысле так называются абсолютно взаимозаменяемые иероглифы без изменения чтения и значения. Аллографичность может достигаться за счёт: (1) добавления элемента (匧:篋 «коробка»); (2) разного подхода к созданию иероглифа (涙:泪 «слёзы» или 韤:韈:?:襪:?:帓:?:袜 «чулки»); (3) разного расположения элементов (蠏:蟹 «краб»); (4) сокращения элемента (灋:法 «закон»); (5) упрощений посредством скорописи (頭:头 «голова»); (6) искажений (珍:珎 «сокровище»); (7) табуирования (玄:? «чёрный»).
В широком смысле аллографами называются иероглифы, лишь частично имеющие одинаковое значение (квазиаллографы). Например, квазиаллографами иероглифа 雕 являются 鵰, 彫, 琱 и 凋. У 雕 есть три основных значения: (1) вид хищной птицы (изначальное); (2) гравировать (заимствованное); (3) чахнуть (заимствованное). Иероглиф 鵰 является аллографом 雕 только в первом значении, 彫 и 琱 только во втором, а 凋 — только в третьем.
Описанный выше пример относится к инклюзивному виду квазиаллографов, т.е. когда использование одного иероглифа включено в использование другого. Есть также неинклюзивный тип, когда два иероглифа имеют одно общее использование, но каждый также имеет свои собственные значения. Например, иероглифы 記 и 紀 взаимозаменяемы, когда используются в значении «записывать» (в сочетаниях вроде {記錄} «протоколировать», {記念} «годовщина», {記要} «краткие сведения», {大事記} «летопись» и т.п.), однако когда {記} используется в качестве самостоятельного слова или в сочетаниях вроде {記憶} «память», {記號} «символ» или {記者} «журналист», иероглиф 紀 использован быть не может. Обычно отношения неинклюзивных квазиаллографов очень сложны, и более того, иногда и вовсе невозможно найти какие-либо закономерности в их употреблении, потому описанная выше связь 記 и 紀 может иметь множество исключений.
Омографы — это разные иероглифы, имеющие одинаковую форму (полная противоположность аллографов). В узком смысле это иероглифы, которые были созданы независимо для записи разных слов, но форма которых случайно оказалась похожа. Например, иероглиф 鉈 в древности записывал слово, обозначающее вид копья; также в досовременную эпоху он мог использоваться как аллограф 砣 «гиря»; сейчас он используется для записи химического элемента «талий». Омографичность может достигаться за счёт: (1) разного подхода к созданию иероглифа (фонограмма 体 «носитель гроба» и составная семантограмма 体 «тело»); (2) передачи разных идей одним способом (фонограммы 椅 «[вид дерева]»; 椅 «стул»; 椅 «хрупкий (о дереве)»); (3) эволюции графической формы или искажения (歹 «плохой» и 歹 (сокращение от 死 «умирать»)). Обычно все они не сосуществуют в одно и то же время.
В широком смысле омографами считаются все иероглифы одной формы, записывающие разные слова. С этой точки зрения омографами должны считаться даже фонетические заимствования: например, 花 «цветок» и 花 «тратить». То же самое и с расширенными значениями вроде 行 «дорога» и 行 «ряд». Для подобных случаев, однако, нет никакого смысла применять термин «омограф», потому здесь они описаны не будут.
Материалы для дополнительного чтения
Западная наука очень сильно отстаёт от китайской в плане исследования иероглифов, потому большинство основополагающих и современных работ существуют исключительно на китайском.
裘錫圭《文字學概要(修訂本)》(2013) (Цю Сигуй, 2013. Основные принципы науки об иероглифах) — Общая история и теория китайского письма.
Qiu Xigui, 2000. Chinese Writing. Translated by Gilbert L. Mattos and Jerry Norman. (Цю Сигуй, 2010. Китайское письмо) — Английский перевод старого издания вышеупомянутой книги.
裘錫圭《裘錫圭學術文集》(2012) (Цю Сигуй, 2012. Собрание научных работ Цю Сигуя) — Сборник научных работ учёного Цю Сигуя. Его работы можно считать революционными для науки о древнем письме и этимологии, они являются чуть ли не современными стандартами использования научного метода в этих областях, потому обязательны к прочтению.
劉釗《古文字構形學(修訂本)》(2011) (Лю Чжао, 2011. Изучение строения древних иероглифов) — Теория строения древних иероглифов.
Imre Galambos, 2006. Orthography of Early Chinese Writing: Evidence from Newly Excavated Manuscripts. (Имре Галамбош, 2006. Орфография раннего китайского письма: данные с недавно откопанных рукописей) — Про особенности орфографии в древних текстах.
張涌泉《漢語俗字研究(增訂本)》(2010) (Чжан Юнцянь, 2010. Исследование простонародных иероглифов китайского языка) — Теория простонародных иероглифов и форм.