对古文字的考释,是正正经经的学术研究,而不是对着字形讲故事说大道理。可惜现在很多对汉字感兴趣的同志们没有清楚地认识到这一点。他们喜欢歪解汉字,喜欢根据字形(或为说文小篆讹形,或为楷书字形)做一些有利于阐发他经学思想的解释(比如这个题干:中国上古时期,选拔人才的方法是取士,在十个青年中选一个优秀的出来,就叫作“士”。士字不是上十下一吗?);或者歪曲黑白,怎么有噱头怎么来,「使古文字研究变成一种哗众取宠或借以吓人的把戏」(可参考我在如何系统地学习小学(文字、音韵、训诂)中列出来的三个典型例子)。
笔者一直认为,对于汉字古文字字形的释形、释义,应该交给专业的古文字学家来做。这是他们的本职工作,而他们也是这个领域的权威。
事 实上,他们做得非常出色。只是因为古文字学这个学科离老百姓的生活太遥远,所以这个学科及其自上个世纪以来取得的巨大成就,一直不为大众所知。也正因为如 此,很多人漠视古文字学家们做出的贡献,拿着个网上扒下来的「甲骨文」就开始大谈「造字本意」,继续在他们歪解、戏说汉字的民科忽悠之路上越走越远。这可 以说是「无知者无畏」吧。
关于这些漠视古文字学家卓越贡献的言论,诸君可看留住汉字叔叔_《活着》底下的评论:
每次看到这种评论,赵某人深为罗振玉、唐兰、容庚、于省吾、姚孝遂等毕生致力于古文字研究的泰斗们感到不平,同时也为前文提及的汉字解说庸俗化感到担忧。于是我决定在专栏中持续补充如何系统地学习小学(文字、音韵、训诂)中落下的第二部分(推荐资料)。
接下来的推荐资料,从中国(含港台)正规学术机构研发和维护的字音、字形索引网站开始,以驳斥「中国官方机构无汉字演变系统化、数据化的数据库」之无知言论。
是为序。
小学堂是一个集字形、字音、字义为一体的综合文字学资料库。这也是笔者最常用的古文字字形检索网站(没有之一)。
这 个资料库是由台湾当地研究机构和高校共同研发而成的,权威性上有保证(当然,原始资料、书籍大多数是大陆过来的);同时这个资料库有政府经费补助,研究机 构和高校的技术支持(无论是文字学专业技术,还是计算机技术),定期更新扩充后续资料,所以它也代表了古文字学的最新研究成果。
在古文字字 形方面,目前小学堂主要收录了甲骨文、金文、楚系简帛文字、秦系简牍文字以及说文小篆字形(其中秦系简牍文字是后加的,所以笔者乐观预计以后可能还有更多 古文字资料库(比如陶文、砖文、货币文字、汉代玺印文字以及战国文字中的三晋文字、齐文字、燕文字等等)扩充进来),算是全世界最全最新的面向公众的古文 字检索资料库。
以下摘录自官方简介:
「小學堂文字學資料庫」是一個形、音、義綜合的文字學資料庫,可提供使用者根據文字的形、音等屬性先檢索出字頭,再透過字頭連接到個別的形、音、義資料庫或字書索引。
本資料庫由行政院國家科學委員會經費補助,臺灣大學中國文學系、中央研究院歷史語言研究所、資訊科學研究所共同開發;臺灣大學整合聲韻資料,中央研究院整合字形資料及開發檢索系統。
本資料庫收錄的字形涵蓋甲骨文、金文、戰國文字(瑾昀按,戰國文字資料庫目前包括楚系簡帛文字、秦系簡牘文字兩个子資料庫)、小篆及楷書,總數超過十八萬字;收錄的聲韻資料涵蓋上古、中古、近代及現代,總數超過一百萬筆;收錄的字書索引資料則超過二十五萬筆。
本 資料庫主要由漢字古今字資料庫及漢字古今音資料庫組成。漢字古今字資料庫由甲骨文、金文、楚系簡帛文字(瑾昀按:這份簡介沒有更新,所以沒有列出後加的 「秦系簡牘文字」)、小篆、異體字表資料庫組成,而漢字古今音資料庫則由上古音、中古音、官話、晉語、吳語、徽語、贛語、湘語、閩語、粵語、平話、客語、 其他土話資料庫組成,各資料庫除可互相連結外,也可獨立使用。
说了这么久了,下面大家跟着笔者实作一次吧。
我们以「泱泱中華」的「中」字为例。
我们在「字形」栏中键入「中」字,接着点击「確定送出」提交请求。(为了方便大陆用户,输入简化字也是可以的,因为资料库检索默认开启了简繁转换。如需关闭简繁转换,可以在检索栏下方的「選項」中进行设置)
接着我们便跳转到了这个页面。对于研究古文字字形的同仁来说,这个页面中最重要的就是笔者画线的部分。
我们可以点击小篆、金文、甲骨文、楚系簡帛文字、秦系簡牘文字以跳转到「中」字的各类古文字字形的资料库做进一步查询。
同 时我们可以依照下方给出的「相關索引」,按图索骥,快速定位到包含「中」字的文字学著作的相关页面(这个笔者在以后的书籍推荐中还会提到)。至于图书,这 个检索网站并不提供,诸位可以自行去网上搜索电子版,或者去图书馆借阅(大多文字学书籍太过昂贵,动辄上千,不建议购买),或者向我索要 PDF 档(如果我有的话)。这个查阅书籍的过程,必不可少。因为字形资料库只提供了最基本的古文字字形,而相关学者对此的考释、解读就只能落实到书籍上了。笔者在文字学研习网站推荐(序)中 提到的「拿着个网上扒下来的『甲骨文』就开始大谈『造字本意』」的「民间科学家」,指的就是这类光顾着看古文字字形,而不看古文字学家考释、解读的人。针 对甲骨文、金文和战国文字的考释,笔者推荐《甲骨文字诂林》、《金文诂林》(含补篇)、《战国古文字典》一读(小学堂都有相关索引)。
(「中」字楚系簡帛文字的相关资料,含古文字字形,以及相关书籍索引。另外每个古文字字形在下方还有列明出处(如郭店楚简、上博简、望山楚简等等))
对于初学者而言,「中」字的字形演變页面也相当有用。这个页面中,资料库按照时间顺序列出了「中」字具有代表性的古文字字形,并且引用了《汉语大字典》的字形解释(主要依《说文解字》,如果《说文解字》有明显错误,则补充近现代文字学家的考释)。(此处笔者就不截图了)
–
以上部分,是笔者对「小学堂」的检索流程做的一个简单的 demo。下面笔者针对古文字隶定字中的缺字问题,介绍一下「小学堂」是如何解决的。
比如甲骨文中的常见字「⿰柰又」,unicode 并没有为他安排编码,这也为古文字的电子化检索带来了不便。
在录入这种生僻的缺字时,我们可以在字形框中用半角括弧()包住缺字的部件,如 「⿰柰又」字则键入「(柰又)」,即可跳转到相关页面,效果如下:
–
关于「小学堂」的介绍,就到此结束了。接下来笔者谈谈除「小学堂」之外,人民群众普遍使用的两个网站,并对此做出客观评价。
- 汉字叔叔的Etymology
在问题汉字叔叔的研究是否属于民科范畴?(题主似乎是因看到我昨天的序文然后过来提问的),@波斯基 老师的回答也道出了我的心声。
我对汉字叔叔的精神,是百分百钦佩的。但是我并不经常使用他的网站。原因如下:
- 汉 字叔叔所扫描的《甲骨文编》和《金文编》,是上个世纪中叶的作品。这两套古文字编放在今天看来,有很多漏释、误释的成份,已经不太适合今天的古文字学研 究。过时的说法,会把不明所以的研究者引向歧途。(所以请不要忽略古文字学家从上个世纪至今的所有劳动成果,抱着上个世纪的书不放)
- 汉字叔叔并没有对古文字中的缺字(比如笔者提到的「⿰柰又」字),做出很好的处理。这也是专业人士与爱好者制作的索引系统的最大不同。
- 汉字叔叔的网站,只列出了从《甲骨文编》、《金文编》、《六书通》、《说文解字》上摘录下来的古文字字形,并没有把古文字学家的考释列上来(哪怕是索引都没有),客观上助长了「民间科学家」漠视古文字学家的劳动成果,自行歪解、戏说汉字的行径。
- 古 文字学的新兴学科——简帛学,研究的是战国、秦汉时期的简帛文字。而这种文字,上接两周金文,下启汉代隶书,是当今古文字学研究的热门和重点所在。 汉字叔叔使用的,仍然是上个世纪的文字学资料,所以对于战国简帛文字这一块,完全没涉及,不能不说是个巨大的遗憾。另一方面,也助长了「民间科学家」事事 以「甲骨文」、「金文」为本,漠视简牍文字字形的事实。(或许他们根本不知道有这个东西吧)
- 检索系统长时间缺少专人维护,存在很明显的错误。如「夏」的甲骨文,明显是「秋」的古文字形错放了字头。如「春」的甲骨文,也是极不可信。
汉 字叔叔所扫描的四本书中,真正对笔者有用的,只有 《六书通》这一本。因为这本书是明末清初的学者撰写的古文字编,搜集的是古代(自汉代以降)发现的先秦文字字形。鉴于这本书的特殊性质,已经没有再作更新 的必要,所以现代人引用《六书通》是没问题的。但是《甲骨文编》、《金文编》,面向的是近现代考古发掘出来的出土文献资料,这类书籍是要跟着文字学的研究 成果常常更新的(至少十年一更新)。
所以各位要是把汉字叔叔的「字源网」用作「小学堂」的补充的话,只要看《六书通》即可,其他古文字字形最好不要轻易相信。
汉典是笔者经常使用的网站之一,不过笔者只用他来查现代各地区字形对比。因为汉典不太适合查询古文字字形。其理由如下:
- 字形太少,每种字形(甲骨文、金文、小篆)才一个,不足以反映问题。这方面汉字叔叔的字源网做得好多了,当然笔者推荐用小学堂。另外汉典也有和汉字叔叔一样的通病,没有战国文字字形。
- 有错放字头的情况,客观上会误导使用者。比如「冑」「胄」不分、「喦」「嵒」不分、「萑」「雈」不分(另参:查《说文解字》不可尽信「汉典」)
- 汉典所列的小篆,有部分现代字体公司制作的字体,完全没学术参考价值。比如这个楷书阶段才形成的「乒」字,汉典竟然列出了小篆字形(经考察,为方正小篆):
笔者的个人建议是,如果没有足够分辨真伪的能力,应该使用小学堂。若有分辨真伪的能力,而且有时候为了图方便(毕竟是大陆网站,访问速度更快,不容易被墙),用用也未尝不可。
现在笔者怀着激动的心情一键一键地敲下此文,这篇文章不教汉字,我要推荐一个网站。
《中华语文知识库》是「中华文化总会」的下属网站,所谓「云端时代的汉字宝库」。
为什么说《中华语文知识库》是「云端时代的汉字宝库」呢?口说无凭,眼见为实。
首页上方就是搜索框,输入汉字点击放大镜按钮查询,简体繁体皆可。
查询结果页面会把所有符合条件的词条都列出来,比如查「崖」字,条件是「字词」,那么查询结果页面就是这样子的。
细心的读者可以发现,《中华语文知识库》采用了严谨且学术的称谓——「台湾标准字」和「大陆规范字」。简体字繁体字正体字残体字都是不严谨不准确不学术的叫法。
细心的读者还可以发现,台湾读音和大陆读音,是有细微差别的。「崖」在台湾,是读作 yái 的,而在内地,这个字读作 yá。
熟悉周杰伦早期专辑的歌迷朋友(比如我)一定会发现,周杰伦唱到「我掉进爱情悬崖,跌太深爬不出来,下降的速度太快,来不及踏上未来」这句的时候,「崖」就是读作 yái 才与整首歌的 ai 韵押韵的。
一不小心唱下去了,我们回到网站来。点击单字,可以进入这个字的汉字词条。
顶上的两个字,一个是「台湾标准字」的写法,一个是「大陆规范字」的写法。在「基本解释」标签页中,这个字的基本音义均被罗列,点击释义框右下角的「陆」按钮,可以跳转到大陆版释义。
接下来,重头戏来了,我们点这个「历代书体」按钮,前方高能,大家注意!
「历代书体」标签页中,罗列了该汉字的「甲骨文」「金文」「篆书」「隶书」「草书」「行书」「楷书」的写法。
细心的读者又发现了,《中华语文知识库》又用了很严谨且学术的措辞——「书体」。没错,我在《简化字(一) – 汉字 – 知乎专栏》一文中提到
我 们甚至可以认为「說」、「説」、「说」是同一个字的不同书体写法,是同一个字的三种不同书写风格,是同一个字的三种不同字形风格;但从字形、字构的角度 看,这就是同一个字。下面这张图里的「请」字,也都可以看过同一个字的不同书体、不同写法(第一行左起第四个字是曾经推行后又被废止的二简字)。
《赵瑾昀在書體與漢字的區別 – 汉字 – 知乎专栏》亦引用道
簡單來說,漢字是一个抽象的稱謂,表達的是由構字部件組成的含有獨立音形義的文字;而書體則是漢字字形的具體表現形式,同一个漢字可以寫成不同的書體,但是仍然認定爲同一个字(在文字學意義上)。
咦,不是要推荐网站么,怎么又开始上课了。
我们回到高能,啊不,我们回到正题来。点击每种书体名后面的播放按钮,网页就会开始播放張炳煌教授的亲笔书写笔迹。
以后再也不用担心「忧郁的台湾乌龟甲骨文怎么写」这种高难度问题了!
值得注意的是,我们平时总是纠结、在意的笔顺问题,在传统汉字文化里是没有那么多严格的限制的,在写出来的字差不多的情况下,死死拘泥于一种所谓的「正确」笔顺是死板无意义的。
最近想学行书的我,看到这个书写示范功能真是大呼惊艳!
感兴趣的朋友可以上网站查一下「左」「右」这两个字的笔顺,这样就能清楚的感受到,汉字「字形」和「书体」在协同演变过程中那种微妙的关系,另外也能获得「只要能把汉字写漂亮的笔顺就是好笔顺」的体会感受。
再点开「汉字源流」标签页,又一股浓浓的严谨且学术的气息扑面而来。
在每个「字体」(这里措辞为「书体」更佳,「字体」是宽泛的称呼)下,罗列了几个代表性的写法,并附注了「出处」。感兴趣的读者不仅可以知道某个汉字在不同时期的写法是什么样的,还可以顺藤摸瓜找到这个字的出处上下文。有了出处还可以更好地实时更新维护这个源流页面。
不过,《中华语文知识库》里的内容也不一定全都是最新的学术观点,比如「龙」的甲骨文,应该是选用了错误的甲骨文字形,張炳煌教授所写的应该是「赢羸」的偏旁「亡口月凡」,一条肥虫,而不是「龙」,「龙」的甲骨文在「汉字源流」标签页下的字形是正确的。
不过,总体来讲,《中华语文知识库》真的是集科普和学术一体的好网站。
劉兆玄在《中华语文知识库》的楔子中提到一个梦
我 有一個夢,夢的前一半是兩岸及世上所有漢字使用者在這個平臺上很快就能作到「正」「簡」兩者皆認識;夢的後一半是所有的使用者擇優而愛用之(市場機制), 透過大夥兒共同書寫,寫出一套最普受歡迎、絕大部分相同的常用漢字;這期間透過學者的申辯引導,兩岸政府的政策推動,在夢醒時分終於達成漢字的再一次「書 同文」。
作为对岸的华人,我不由得对台湾教育部、「中华文化总会」肃然起敬。我希望,在这个信息技术时代,汉字也可以搭上快速行驶的列车,让源远流长的中华文化,保持无穷的生命力,成为中华儿女永恒的「宝藏」。
關於久茂語林(Outlier Linguistic Solutions)
久茂語林有限公司位於台灣台北,是由三位西方研究人員組成的語言學軟體開發公司。工作團隊致力於開發語言學和語言學習的實用工具。服務對象廣泛,從學中文的外國學生,到在大學教書的教授均為客群。
我們於華語地區生活及工作,合起來有27年了。當中在台灣的大學求學積累了17年,加起來的研究所課程時數達91學分,大學部課程時數也達117學分。我們所修的課程皆為中文授課,撰寫文章、論文、發表內容亦均以中文為主。
本公司正全力開發一部漢字電子字典,欲將中華文化精髓的「漢字」推楊全球,讓外國人能用正確的思維和概念了解漢字。
本 公司以確實、嚴謹的科學方法及現代古文字學研究方法為主幹,運用上古漢語、出土文獻、漢字字源及演變的最新研究發現,以深入淺出的概念、簡明易懂的文筆, 將漢字寫成一部雙語字典。如此能看到漢字從古至今最真實的來龍去脈、看到漢字的歷史演變。另外,本字典還會闡明每個漢字的偏旁(即具有功能的結構)及其偏 旁如何發揮作用,以便豐富大家的漢字知識,解決一些對漢字長期以來的偏見。
這部字典既適合課程使用也有助於自我學習。全文以中文撰寫,並譯入各種語言(已計劃譯入英語及德語)。各版本皆以雙語呈現,讓中文教師及中文學習者都能方便使用。
中文主頁:久茂語林
英文主頁:Home – Outlier Linguistic Solutions
以下是在久茂語林的部落格上發布的文章,內容質量非常不錯(有興趣者,歡迎訂閱):
先秦甲骨金文简牍词汇资料库
网址:先秦甲骨金文簡牘詞彙資料庫 Lexicon of Pre-Qin Oracle, Bronze Inscriptions and Bamboo Scripts
简介:台湾中央研究院历史语言研究所制作。相当于一个出土文献的语料库。
殷周金文暨青铜器资料库
网址:殷周金文暨青銅器資料庫
简介:同上也是史语所作品,可配合上一个「先秦词汇资料库」使用,查到辞例之后想要看看原器,就可以通过编号查寻到。 按:网站是需要申请注册的,下载一个注册表格,填写完用电邮申请即可。
历史语言研究所藏汉代简牍资料库
简介:同上也是史语所作品,收录了西汉中晚期至东汉早期的简牍文字的内容,图版较为清晰。
中国古代简帛字形、辞例数据库
简介:武汉大学简帛研究中心制作。主要是简帛的字形和辞例。因为伺服器负载有限,未开放注册。非注册用户,有浏览限制,只能浏览前十条搜索结果。
简帛网
简介:武汉大学简帛研究中心官网。简帛学方面的论文。
华东师范大学文字中心
简介:华东师范大学中国文字研究与应用中心官网。有价值的地方是该中心首发的论文(论文另见于纸质版中心刊物《中国文字研究》)以及数字化资源库。
复旦大学出土文献与古文字研究中心
简介:复旦大学出土文献与古文字研究中心的官网,收录了最新投稿的文字学论文(论文另见于纸质版中心刊物《出土文献与古文字研究》)以及学界的动态、书讯。
先秦史研究室
网址:先秦史研究室
简介:中国社会科学院中国历史研究所先秦史研究室官网,甲金文方面的论文。
引得市
网址:Index 引得市
简 介:小学网下部的引得,部分是来自引得市的,两者有交集。但也有互相没有的部分,可以作为补充。(瑾昀按:引得市的作者阿良兄为笔者朋友,平常多有资源交 流。阿良兄这些年来一直致力于文字编检字表的数位化工作,至今已经有逾百部文字编的引得。我平时使用的古文字资料基本都是通过引得市查询后快速定位到书籍 获取的。强烈推荐!)
中华博物
网址:工具书 | 中华博物
简介:比较有用的就是徐中舒《甲骨文字典》、容庚《金文编》(第三版)、《说文解字注》。瑾昀按:
- 该站误将容庚《金文编》(第三版)命名为《金文字典》,特此纠正。「字编」与「字典」的体例不同,前者只收字形,后者除了字形外还兼收文献中的释义、用例。真正的金文字典是《金文大字典》(戴家祥·學林出版社·1995)。
- 目前使用较多的《金文编》版本是1985年中华书局出版的第四版,与第三版对比,修订了相当多的内容(详见四版《金文编》的后记)。四版《金文编》引得可从小学堂获取。
- 「中 华博物」是本文列出的内容中唯一一个非正规研究机构制作的网站,只因以上三本书的检索十分方便,所以才列了出来。但是读者应该要知道「中华博物」收录的材 料良莠不齐,使用时千万要注意甄别。比如上个世纪的书画家康殷所著《文字源流浅析》喜欢「望形生意」,单凭图形提供给他的印象立说,不考虑语言文字的实际 用法。因此建议初学者千万不要读,以免先入为主、听不进正确的意见。详见《评康殷文字学》(夏渌·武汉大学出版社·1991,链接: 百度云 请输入提取密码 密码: jijj)。
教育部异体字字典
网址:教育部異體字字典
简介:中华民国教育部编纂的一款大型的线上字典。字形资料详实丰富,比较完整地收录了历代字书书影。强烈推荐!
拓本文字资料库
网址:拓本文字データベース
简介:日本京都大学制作的拓本文字资料库,收录了汉代至民国的拓本文字资料。
汉语多功能字库
网址:漢語多功能字庫 Multi-function Chinese Character Database
简介:香港中文大学人文电算研究中心制作,所收录的古文字字形切合如今古文字学的研究现状(特别是大量的简牍材料),「形义通解」栏目对初学者了解常用汉字的音形义帮助甚大,强烈推荐!
————————
往期的汉字科普网站推荐文章: