From 4cb32f0ce2835f0bad087e217e24d5195840feff Mon Sep 17 00:00:00 2001 From: Claude Date: Sat, 24 Jan 2026 19:08:45 +0000 Subject: [PATCH 1/8] Fix incorrect character conversions in STPhrases.txt MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Fixed 4 incorrect simplified-to-traditional Chinese conversion pairs: 1. 一哄而上 → 一鬨而上 (was incorrectly staying as 一哄而上) 2. 一哄而起 → 一鬨而起 (was incorrectly staying as 一哄而起) 3. 一哄而集 → 一鬨而集 (was incorrectly staying as 一哄而集) 4. 丁零当啷 → 丁零噹啷 (was incorrectly using 當 instead of 噹) These fixes ensure consistency with related entries: - Line 68: 一哄 → 一鬨 (already correct) - Line 70: 一哄而散 → 一鬨而散 (already correct) - Line 290: 丁铃当啷 → 丁鈴噹啷 (already correct) The character 鬨 is used for noisy crowds/commotion, and 噹 is the onomatopoeia for metallic clanging sounds. --- data/dictionary/STPhrases.txt | 8 ++++---- 1 file changed, 4 insertions(+), 4 deletions(-) diff --git a/data/dictionary/STPhrases.txt b/data/dictionary/STPhrases.txt index 9de923e1..5461f88c 100644 --- a/data/dictionary/STPhrases.txt +++ b/data/dictionary/STPhrases.txt @@ -67,10 +67,10 @@ 一周年 一週年 一周遭 一周遭 一哄 一鬨 -一哄而上 一哄而上 +一哄而上 一鬨而上 一哄而散 一鬨而散 -一哄而起 一哄而起 -一哄而集 一哄而集 +一哄而起 一鬨而起 +一哄而集 一鬨而集 一喊出 一喊出 一回 一回 一回事 一回事 @@ -289,7 +289,7 @@ 丁种维生素 丁種維生素 丁里 丁里 丁铃当啷 丁鈴噹啷 -丁零当啷 丁零當啷 +丁零当啷 丁零噹啷 丁鸿志 丁鴻志 七万 七萬 七万三千 七萬三千 From 4d17fad943c3966d84acc8ce5aab7caf7364441c Mon Sep 17 00:00:00 2001 From: Claude Date: Sat, 24 Jan 2026 19:53:15 +0000 Subject: [PATCH 2/8] =?UTF-8?q?Fix=20incorrect=20=E5=93=84/=E9=AC=A8=20cha?= =?UTF-8?q?racter=20conversions=20in=20STPhrases.txt?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Fixed 4 entries that incorrectly used 哄 instead of 鬨 in commotion/uproar contexts: - 乱哄哄 (line 2444) - 哄动一时 (line 15004) - 热闹哄哄 (line 34153) - 闹哄哄 (line 46666) --- data/dictionary/STPhrases.txt | 8 ++++---- 1 file changed, 4 insertions(+), 4 deletions(-) diff --git a/data/dictionary/STPhrases.txt b/data/dictionary/STPhrases.txt index 5461f88c..d69eb4bc 100644 --- a/data/dictionary/STPhrases.txt +++ b/data/dictionary/STPhrases.txt @@ -2441,7 +2441,7 @@ 乱发 亂髮 乱哄 亂鬨 乱哄不过来 亂鬨不過來 -乱哄哄 亂哄哄 +乱哄哄 亂鬨鬨 乱成一团 亂成一團 乱扣 亂扣 乱搞男女关系 亂搞男女關係 @@ -15001,7 +15001,7 @@ 哄传一时 哄傳一時 哄劝 哄勸 哄动 鬨動 -哄动一时 哄動一時 +哄动一时 鬨動一時 哄吓骗诈 哄嚇騙詐 哄哄 哄哄 哄哄翕翕 哄哄翕翕 @@ -34150,7 +34150,7 @@ 热药 熱藥 热衷于 熱衷於 热量表 熱量表 -热闹哄哄 熱鬧哄哄 +热闹哄哄 熱鬧鬨鬨 烹制 烹製 烹调术 烹調術 烽火台 烽火臺 @@ -46663,7 +46663,7 @@ 闹别扭 鬧彆扭 闹台 鬧臺 闹哄 鬧鬨 -闹哄哄 鬧哄哄 +闹哄哄 鬧鬨鬨 闹拧了 鬧擰了 闹着玩儿 鬧着玩兒 闹表 鬧錶 From ca4e7ead432fcae8e5b3fca8cb0bd6b390a287e4 Mon Sep 17 00:00:00 2001 From: Claude Date: Sat, 24 Jan 2026 23:46:46 +0000 Subject: [PATCH 3/8] =?UTF-8?q?Fix=20incorrect=20=E9=90=98/=E9=8D=BE=20and?= =?UTF-8?q?=20=E9=90=98=E9=8C=B6=20character=20conversions=20in=20STPhrase?= =?UTF-8?q?s.txt?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Fixed 5 entries with incorrect traditional character usage: - Line 46119: 钟意 (to like) now correctly uses 鍾意 instead of 鐘意 - Lines 1884, 17341, 19016: 钟表面 (watch face) now correctly uses 鐘錶面 instead of 鐘表面 - Line 46156: 钟表盘 (watch dial) now correctly uses 鐘錶盤 instead of 鐘表盤 鐘 is for clock/bell, 鍾 is for emotion/affection, 錶 is for watch/timepiece --- data/dictionary/STPhrases.txt | 10 +++++----- 1 file changed, 5 insertions(+), 5 deletions(-) diff --git a/data/dictionary/STPhrases.txt b/data/dictionary/STPhrases.txt index d69eb4bc..b9c371c7 100644 --- a/data/dictionary/STPhrases.txt +++ b/data/dictionary/STPhrases.txt @@ -1881,7 +1881,7 @@ 中国国民党 中國國民黨 中型钟 中型鐘 中型钟表 中型鐘錶 -中型钟表面 中型鐘表面 +中型钟表面 中型鐘錶面 中型钟面 中型鐘面 中央专制集权 中央專制集權 中央党 中央黨 @@ -17338,7 +17338,7 @@ 大场面 大場面 大型钟 大型鐘 大型钟表 大型鐘錶 -大型钟表面 大型鐘表面 +大型钟表面 大型鐘錶面 大型钟面 大型鐘面 大天后宫 大天后宮 大夫松 大夫松 @@ -19013,7 +19013,7 @@ 小型柜橱 小型櫃櫥 小型钟 小型鐘 小型钟表 小型鐘錶 -小型钟表面 小型鐘表面 +小型钟表面 小型鐘錶面 小型钟面 小型鐘面 小夜曲 小夜曲 小天后 小天后 @@ -46116,7 +46116,7 @@ 钟律 鐘律 钟快 鐘快 钟情 鍾情 -钟意 鐘意 +钟意 鍾意 钟慢 鐘慢 钟摆 鐘擺 钟敲 鐘敲 @@ -46153,7 +46153,7 @@ 钟行 鐘行 钟表 鐘錶 钟表停 鐘錶停 -钟表盘 鐘表盤 +钟表盘 鐘錶盤 钟被 鐘被 钟调 鐘調 钟身 鐘身 From bdcf1a11eb6ae88fdb5bedb97627f49b4be42dba Mon Sep 17 00:00:00 2001 From: Claude Date: Sun, 25 Jan 2026 00:07:52 +0000 Subject: [PATCH 4/8] =?UTF-8?q?Fix=20incorrect=20=E7=95=B6/=E5=99=B9=20cha?= =?UTF-8?q?racter=20conversions=20in=20STPhrases.txt?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Fixed 3 onomatopoeia entries that incorrectly used 當 instead of 噹: - Line 278: 丁丁当当 now correctly uses 丁丁噹噹 - Line 286: 丁当 now correctly uses 丁噹 - Line 21965: 当当丁丁 now correctly uses 噹噹丁丁 當 is for "should/proper/serve as", 噹 is for metallic clanging sounds --- data/dictionary/STPhrases.txt | 6 +++--- 1 file changed, 3 insertions(+), 3 deletions(-) diff --git a/data/dictionary/STPhrases.txt b/data/dictionary/STPhrases.txt index b9c371c7..8e424ef6 100644 --- a/data/dictionary/STPhrases.txt +++ b/data/dictionary/STPhrases.txt @@ -275,7 +275,7 @@ 一龙生九种种种各别 一龍生九種種種各別 丁一确二 丁一確二 丁丁冬冬 丁丁冬冬 -丁丁当当 丁丁當當 +丁丁当当 丁丁噹噹 丁丑 丁丑 丁伯升 丁伯升 丁克 丁克 @@ -283,7 +283,7 @@ 丁固生松 丁固生松 丁娘十索 丁娘十索 丁字梁 丁字梁 -丁当 丁當 +丁当 丁噹 丁柏升 丁柏升 丁种 丁種 丁种维生素 丁種維生素 @@ -21962,7 +21962,7 @@ 当归 當歸 当归鸭 當歸鴨 当当 噹噹 -当当丁丁 當當丁丁 +当当丁丁 噹噹丁丁 当当当 噹噹噹 当当船 噹噹船 当当车 噹噹車 From c9b7decd95f8cb9a48c5fa14060779f87688fedb Mon Sep 17 00:00:00 2001 From: Claude Date: Sun, 25 Jan 2026 00:16:56 +0000 Subject: [PATCH 5/8] =?UTF-8?q?Fix=20additional=20=E5=99=B9=20and=20?= =?UTF-8?q?=E9=AC=A8=20character=20conversion=20errors=20in=20STPhrases.tx?= =?UTF-8?q?t?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Fixed 4 entries with incorrect traditional character usage: - Line 13187: 吉丁当 now correctly uses 吉丁噹 (onomatopoeia) - Line 15000: 哄传 now correctly uses 鬨傳 (spread tumultuously) - Line 15001: 哄传一时 now correctly uses 鬨傳一時 (cause sensation) - Line 15012: 哄抢 now correctly uses 鬨搶 (scramble to loot) 噹 is for metallic sounds, 鬨 is for rowdy/tumultuous actions --- data/dictionary/STPhrases.txt | 8 ++++---- 1 file changed, 4 insertions(+), 4 deletions(-) diff --git a/data/dictionary/STPhrases.txt b/data/dictionary/STPhrases.txt index 8e424ef6..58881ea1 100644 --- a/data/dictionary/STPhrases.txt +++ b/data/dictionary/STPhrases.txt @@ -13184,7 +13184,7 @@ 合髻 合髻 合龙 合龍 合龙门 合龍門 -吉丁当 吉丁當 +吉丁当 吉丁噹 吉伯特氏症候群 吉伯特氏症候羣 吉凶 吉凶 吉凶庆吊 吉凶慶弔 @@ -14997,8 +14997,8 @@ 哄了 哄了 哄人 哄人 哄伙 鬨夥 -哄传 哄傳 -哄传一时 哄傳一時 +哄传 鬨傳 +哄传一时 鬨傳一時 哄劝 哄勸 哄动 鬨動 哄动一时 鬨動一時 @@ -15009,7 +15009,7 @@ 哄堂大笑 鬨堂大笑 哄弄 哄弄 哄得 哄得 -哄抢 哄搶 +哄抢 鬨搶 哄抬 哄擡 哄抬物价 哄擡物價 哄来哄去 哄來哄去 From 5ac2a23b7224451d74864697ad5031a053f45ff9 Mon Sep 17 00:00:00 2001 From: Claude Date: Sun, 25 Jan 2026 00:29:30 +0000 Subject: [PATCH 6/8] =?UTF-8?q?Fix=20=E9=AC=A8,=20=E4=BD=94,=20=E7=B7=BB,?= =?UTF-8?q?=20and=20=E9=8C=B6=20character=20conversion=20errors=20in=20STP?= =?UTF-8?q?hrases.txt?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Fixed 8 entries with incorrect traditional character usage: - Line 14996: 哄乱 now correctly uses 鬨亂 (cause chaos) - Line 9940: 占主导地位 now correctly uses 佔主導地位 (occupy position) - Line 9946: 占亲 now correctly uses 佔親 (take advantage of kinship) - Line 9947: 占人 now correctly uses 佔人 (take advantage of people) - Line 33661: 澄澹精致 now correctly uses 澄澹精緻 (exquisite) - Line 8271: 别致有趣 now correctly uses 別緻有趣 (unique and interesting) - Line 48148: 风流别致 now correctly uses 風流別緻 (elegant and distinctive) - Line 34199: 煤气表 now correctly uses 煤氣錶 (gas meter) 鬨=uproar, 佔=occupy, 緻=fine/delicate, 錶=meter/gauge --- data/dictionary/STPhrases.txt | 16 ++++++++-------- 1 file changed, 8 insertions(+), 8 deletions(-) diff --git a/data/dictionary/STPhrases.txt b/data/dictionary/STPhrases.txt index 58881ea1..1855941a 100644 --- a/data/dictionary/STPhrases.txt +++ b/data/dictionary/STPhrases.txt @@ -8268,7 +8268,7 @@ 别罐 別罐 别脚 別腳 别致 別緻 -别致有趣 別致有趣 +别致有趣 別緻有趣 别苗头 別苗頭 别被 別被 别裁 別裁 @@ -9937,14 +9937,14 @@ 占为 佔爲 占为己有 佔爲己有 占主 佔主 -占主导地位 占主導地位 +占主导地位 佔主導地位 占九 佔九 占了 佔了 占了卜 占了卜 占二 佔二 占五 佔五 -占亲 占親 -占人 占人 +占亲 佔親 +占人 佔人 占人便宜 佔人便宜 占亿 佔億 占优 佔優 @@ -14993,7 +14993,7 @@ 品貌出众 品貌出衆 品质管制 品質管制 品鉴 品鑑 -哄乱 哄亂 +哄乱 鬨亂 哄了 哄了 哄人 哄人 哄伙 鬨夥 @@ -33658,7 +33658,7 @@ 潮力发电 潮力發電 潮烟 潮菸 澄江 澂江 -澄澹精致 澄澹精致 +澄澹精致 澄澹精緻 澎湖天后宫 澎湖天后宮 澒蒙 澒濛 澥谷 澥谷 @@ -34196,7 +34196,7 @@ 煞费周章 煞費周章 煤核 煤核 煤气工厂 煤氣工廠 -煤气表 煤氣表 +煤气表 煤氣錶 煤烟 煤煙 煤系 煤系 煤铲 煤鏟 @@ -48145,7 +48145,7 @@ 风月宝鉴 風月寶鑑 风水术 風水術 风流云散 風流雲散 -风流别致 風流別致 +风流别致 風流別緻 风流千古 風流千古 风流才子 風流才子 风流标致 風流標致 From e88fd1656c76b9d320aec2334bef0d1ccac1f193 Mon Sep 17 00:00:00 2001 From: Carbo Kuo Date: Tue, 27 Jan 2026 20:47:30 +1300 Subject: [PATCH 7/8] manual fixes --- data/dictionary/STPhrases.txt | 11 +++++------ 1 file changed, 5 insertions(+), 6 deletions(-) diff --git a/data/dictionary/STPhrases.txt b/data/dictionary/STPhrases.txt index 1855941a..b75ec2fe 100644 --- a/data/dictionary/STPhrases.txt +++ b/data/dictionary/STPhrases.txt @@ -1881,7 +1881,6 @@ 中国国民党 中國國民黨 中型钟 中型鐘 中型钟表 中型鐘錶 -中型钟表面 中型鐘錶面 中型钟面 中型鐘面 中央专制集权 中央專制集權 中央党 中央黨 @@ -9943,8 +9942,8 @@ 占了卜 占了卜 占二 佔二 占五 佔五 -占亲 佔親 -占人 佔人 +占亲 占親 +占人 占人 占人便宜 佔人便宜 占亿 佔億 占优 佔優 @@ -9952,7 +9951,6 @@ 占位 佔位 占住 佔住 占便宜 佔便宜 -占便宜的是呆 佔便宜的是呆 占俄 佔俄 占候 占候 占停车 佔停車 @@ -9975,6 +9973,9 @@ 占卜师 占卜師 占卜术 占卜術 占占 佔佔 +占占卜 占占卜 +占占卜 占占卜 +占占卦 占占卦 占卦 占卦 占印 佔印 占压 佔壓 @@ -17338,7 +17339,6 @@ 大场面 大場面 大型钟 大型鐘 大型钟表 大型鐘錶 -大型钟表面 大型鐘錶面 大型钟面 大型鐘面 大天后宫 大天后宮 大夫松 大夫松 @@ -19013,7 +19013,6 @@ 小型柜橱 小型櫃櫥 小型钟 小型鐘 小型钟表 小型鐘錶 -小型钟表面 小型鐘錶面 小型钟面 小型鐘面 小夜曲 小夜曲 小天后 小天后 From 4bdc688ef76e688768817633a6147c7f84b442c8 Mon Sep 17 00:00:00 2001 From: Claude Date: Tue, 27 Jan 2026 07:57:35 +0000 Subject: [PATCH 8/8] =?UTF-8?q?Fix=20duplicate=20key=20and=20=E8=AA=BF?= =?UTF-8?q?=E5=88=B6/=E8=AA=BF=E8=A3=BD=20errors=20in=20STPhrases.txt?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Fixed 3 issues found by tests: - Removed duplicate entry at line 9977: 占占卜 (causing "duplicated keys" error) - Line 27040: 数据调制解调器 now correctly uses 數據調製解調器 (not 調制) - Line 35244: 电缆调制解调器 now correctly uses 電纜調製解調器 (not 調制) 制 vs 製: 製 is used for "modulation" (調製), 制 is for "system/制度" --- data/dictionary/STPhrases.txt | 5 ++--- 1 file changed, 2 insertions(+), 3 deletions(-) diff --git a/data/dictionary/STPhrases.txt b/data/dictionary/STPhrases.txt index 0ddfc5b0..b5163908 100644 --- a/data/dictionary/STPhrases.txt +++ b/data/dictionary/STPhrases.txt @@ -9974,7 +9974,6 @@ 占卜术 占卜術 占占 佔佔 占占卜 占占卜 -占占卜 占占卜 占占卦 占占卦 占卦 占卦 占印 佔印 @@ -27038,7 +27037,7 @@ 数据源 數據源 数据结构 數據結構 数据网络 數據網絡 -数据调制解调器 數據調制解調器 +数据调制解调器 數據調製解調器 数据资料 數據資料 数据通信 數據通信 数据通讯 數據通訊 @@ -35242,7 +35241,7 @@ 电磁振荡 電磁振盪 电磁脉冲 電磁脈衝 电线杆 電線杆 -电缆调制解调器 電纜調制解調器 +电缆调制解调器 電纜調製解調器 电胡刀 電鬍刀 电脑与电话系统整合 電腦與電話系統整合 电脑互动艺术 電腦互動藝術