From f965f6729000965c0ff3d2312c00aa73d4abba5b Mon Sep 17 00:00:00 2001 From: Danny Lin Date: Thu, 29 Jan 2026 09:10:37 +0800 Subject: [PATCH] =?UTF-8?q?Fix=20=E4=B8=81=E7=95=B6=20related=20phrases?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- data/dictionary/STPhrases.txt | 12 ++++++++---- data/dictionary/TWPhrases.txt | 4 ++++ data/dictionary/TWPhrasesRev.txt | 3 +++ test/testcases/testcases.json | 20 ++++++++++++++++++++ 4 files changed, 35 insertions(+), 4 deletions(-) diff --git a/data/dictionary/STPhrases.txt b/data/dictionary/STPhrases.txt index b5163908..0402d17d 100644 --- a/data/dictionary/STPhrases.txt +++ b/data/dictionary/STPhrases.txt @@ -275,7 +275,8 @@ 一龙生九种种种各别 一龍生九種種種各別 丁一确二 丁一確二 丁丁冬冬 丁丁冬冬 -丁丁当当 丁丁噹噹 +丁丁当 丁丁當 +丁丁当当 丁丁當當 丁丑 丁丑 丁伯升 丁伯升 丁克 丁克 @@ -283,7 +284,7 @@ 丁固生松 丁固生松 丁娘十索 丁娘十索 丁字梁 丁字梁 -丁当 丁噹 +丁当 丁當 丁噹 丁柏升 丁柏升 丁种 丁種 丁种维生素 丁種維生素 @@ -12125,6 +12126,7 @@ 召回 召回 召幸 召幸 叮人战术 叮人戰術 +叮叮当 叮叮噹 叮叮当当 叮叮噹噹 叮叮当当的婆娘 叮叮噹噹的婆娘 叮当 叮噹 @@ -13184,7 +13186,7 @@ 合髻 合髻 合龙 合龍 合龙门 合龍門 -吉丁当 吉丁噹 +吉丁当 吉丁當 吉伯特氏症候群 吉伯特氏症候羣 吉凶 吉凶 吉凶庆吊 吉凶慶弔 @@ -21962,7 +21964,7 @@ 当归 當歸 当归鸭 當歸鴨 当当 噹噹 -当当丁丁 噹噹丁丁 +当当丁丁 當當丁丁 当当当 噹噹噹 当当船 噹噹船 当当车 噹噹車 @@ -31041,6 +31043,7 @@ 歌坛上 歌壇上 歌坛新秀 歌壇新秀 歌声绕梁 歌聲繞梁 +歌手丁当 歌手丁噹 歌曲 歌曲 歌板 歌板 歌舞升平 歌舞昇平 @@ -38426,6 +38429,7 @@ 绑回去 綁回去 绑回来 綁回來 绑扎 綁紮 +绑架丁丁当 綁架丁丁當 绒布 絨布 结了 結了 结仇 結仇 diff --git a/data/dictionary/TWPhrases.txt b/data/dictionary/TWPhrases.txt index 3639158b..58811232 100644 --- a/data/dictionary/TWPhrases.txt +++ b/data/dictionary/TWPhrases.txt @@ -9,6 +9,9 @@ PN結 PN接面 SQL注入 SQL隱碼攻擊 SQL注入攻擊 SQL隱碼攻擊 U盤 隨身碟 +丁丁當 叮叮噹 +丁丁當當 叮叮噹噹 +丁當 叮噹 三極管 三極體 下拉列表 下拉式清單 並行計算 平行計算 @@ -366,6 +369,7 @@ U盤 隨身碟 索馬里 索馬利亞 組件 元件 綁定 繫結 +綁架丁丁當 綁架丁丁當 網上鄰居 網路上的芳鄰 網卡 網絡卡 網吧 網咖 diff --git a/data/dictionary/TWPhrasesRev.txt b/data/dictionary/TWPhrasesRev.txt index 909e374b..7508ee2d 100644 --- a/data/dictionary/TWPhrasesRev.txt +++ b/data/dictionary/TWPhrasesRev.txt @@ -98,6 +98,9 @@ SQL隱碼攻擊 SQL注入 SQL注入攻擊 取樣 採樣 取樣率 採樣率 叢集 集羣 +叮叮噹 丁丁當 +叮叮噹噹 丁丁當當 +叮噹 丁當 史瓦濟蘭 斯威士蘭 吉布地 吉布堤 吉里巴斯 基里巴斯 diff --git a/test/testcases/testcases.json b/test/testcases/testcases.json index 9b659976..5ea71aa9 100755 --- a/test/testcases/testcases.json +++ b/test/testcases/testcases.json @@ -473,6 +473,26 @@ "tw2s": "社群 索罗门群岛 核取方块 核取按钮", "t2s": "社群 索罗门群岛 核取方块 核取按钮" } + }, + { + "input": "丁当 歌手丁当 丁丁当当 当当丁丁 绑架丁丁当", + "expected": { + "s2t": "丁當 歌手丁噹 丁丁當當 當當丁丁 綁架丁丁當", + "s2twp": "叮噹 歌手丁噹 叮叮噹噹 當當丁丁 綁架丁丁當" + } + }, + { + "input": "叮当 叮叮当 叮叮当当", + "expected": { + "s2t": "叮噹 叮叮噹 叮叮噹噹", + "s2twp": "叮噹 叮叮噹 叮叮噹噹" + } + }, + { + "input": "叮噹 歌手丁噹 叮叮噹 叮叮噹噹 當當丁丁 綁架丁丁當", + "expected": { + "tw2sp": "丁当 歌手丁当 丁丁当 丁丁当当 当当丁丁 绑架丁丁当" + } } ] }