日本精品不卡,精品综合久久久久久97超人该,久久国产精品久久国产精品,www.奇米第四色,亚洲黄色激情网,免费萌白酱国产一区二区三区

分享到:

包裝網全國直通:  北京  天津  上海  重慶  暫存  河北  山西  內蒙  遼寧  吉林  黑龍江  湖北  湖南  河南  山東  浙江  江西  江蘇  安徽 

更多>>

探討古籍數字化的窘境與生機
2011-11-09 09:09:49   來源:   評論:0 點擊:

  數字化是一場巨大的革命,正深刻影響著我們的生活,每個領域幾乎都被卷入其中,即便是甘守寂寞的古籍,也概莫能外。20世紀70年代末古籍數字化最早開始于的美國;80年代,港臺地區探路于前;90年代,中國繼踵于后。進入21世紀,古籍數字化已呈星火燎原之勢,發展之迅猛超乎意料。

  然而近兩年,古籍數字化的步伐卻有所放緩,呈現瓶頸效應,又仿佛一只即將破繭的蝴蝶,在靜靜積蓄力量。

  金秋時節,50余家學術及出版機構的60余名專家學者,從海內外各個角落齊聚北京,第三屆中國古籍數字化國際學術研討會如約舉行。古籍數字化突破瓶頸,期待同業者的集思廣益群策群力;會上,新觀點、新思想的碰撞,新技術、新成果的涌現,無不呼應著古籍數字化前進的步伐。

  窘 境

  人人都羨慕陽光下蝴蝶的美麗,又有誰知道黑暗中蛻變的痛苦滋味。

  (一)標準之爭——標準缺乏,各自成理

  會議伊始,原國家古籍整理出版規劃小組辦公室主任許逸民便把一個大家最關切的問題提了出來——漢字簡繁轉換問題。如何處理轉換過程中的異體字,是所有古籍整理者都望而生畏的難關,因為這不僅牽涉到全文檢索,更會引發學術爭議。繁體字正字表至今尚無國家標準,致使同一字在古籍出版物和數據庫中出現不同字形,如“為”和“爲”,“劍”和“劒”,孰正孰異,莫衷一是,天下擾攘,亂相遂生。

  當前最迫切需要的便是建立古籍數字化的國家標準,奈何主管部門礙于諸般顧慮,始終未能著手制定。首都師范大學中國詩歌研究中心主任趙敏俐感慨:古籍數字化的發展過程中,民間的積極性非常高,不斷有學者呼吁建立國家標準;或退而求其次,先由民間建立通用標準,再得到國家認定也可。但如果這套民間標準真的推出,國家是否會予以認定,他對此深表懷疑。

  首都師范大學周文業研究員形容當前中國大陸的古籍數字化現狀為“春秋戰國,群雄割據”。上世紀90年代古籍數字化在中國剛興起之際,政府未能及時介入,徒然錯失先機,如今爭霸局面已成,再想統一,為時晚矣!

  盡管如此,大多數學者還是希望古籍數字化能有一套起碼的標準通行。會議主辦方、首都師范大學電子文獻研究所所長尹小林提出了建設古籍數據庫的八條標準:其一,有確定的底本和書目提要;其二,文字差錯率小于萬分之一;其三,有簡繁體兩種文字,并實現相互對應;其四,應帶有新式標點;其五,含高清版的底本圖像(可實現8倍縮放);其六,提供智能化的全文檢索(Unicode內核);其七,具有智能數據分析統計工具;其八,可實現多種數據格式的轉換和輸出。這八條標準都是在古籍數字化工作過程中逐漸總結形成的,具有很強的專業性和實用性,因而獲得了與會專家們的一致認可。

  與建立標準息息相關的還有資源整合問題,河南新鄉學院文學院副教授毛建軍認為,資源整合是一項龐大而長期的工程,非朝夕之間能夠完成,建立古籍數字化資源導航庫將不失為一種方便快捷、切實可行的整合方式,并建議從數據庫類型、建置單位和數據庫主題三種途徑進行導航設計。

  標準如綱,導航如網,綱振網舉,方可盡攬群籍。

  (二)版權之爭——天下公器,安能獨私

  由于古籍真正的作者皆已作古,無法穿越時空來捍衛自己的原創地位,因此古籍早已作為文化遺產被納入了公共知識的范疇。所謂古籍的版權,實際是針對整理者而言的。

  如今常見的古籍絕大多數都已被點校出版,版權握于傳統出版社之手。為了避免糾紛,數字出版者們只好舍近求遠,返擇古本為底本,重起整理之爐灶,可還是難免“抄襲”嫌疑。

     古籍整理猶如積薪,后來居上,一代又一代學者無不是站在前人的肩上,向著理想中的最佳版本一步又一步邁近。前人遇到的坎,后人學會跨過。前人走錯的路,后人不必再走。如果因為整理在先,傳統出版便將大批古籍資源壟斷在手;如果因為點校相似,數字出版便被想當然地認定有侵權之嫌;那么古籍的命運就當真堪憂了。

  中華書局編審劉尚慈不無遺憾地說:“真正的最佳版本存在于當下,就是那些經過專家標點校勘過的本子。我們的古籍最應該數字化這些本子,可惜卻受到版權限制,沒有辦法進行。而真正擁有版權的出版社,卻又沒有能力進行。”

  高校古委會秘書處副秘書長盧偉希望在互聯網上建立一個開放的資源平臺,“怎么能夠在共享和利益之間找到平衡,讓大多數的學者都愿意把自己的成果投入進來”,是這個平臺建立的關鍵。

  生 機

  一只蝴蝶扇動翅膀,不久的將來會在遙遠的彼岸掀起一場颶風。

  古籍數字化發展至今,坐擁海量古籍資源,除了全文檢索、聯機字典、圖文對照、繁簡轉換之外,數字化究竟還能做些什么?

  本屆會議為這個問題帶來了幾種可能的答案。

  (一)版本比對與輔助標點——人力有盡,天道無窮

  人類智慧無敵,機器效率無敵,人機合一,所向披靡。這正是古籍數字化孜孜以求的理想境界,雖然目前尚無法達到,卻依然不乏希望。會上首都師范大學電子文獻研究所演示的古籍智能版本比對和輔助標點系統,便讓人眼前一亮。

  所謂智能版本比對,指能自動進行多種版本的逐字比對,完成后即可標示出文字和符號的任何差異。所謂智能輔助標點,則使用了前沿的人工智能算法和多種資源庫,理想狀態下自動標點準確率在99.5%以上,機器無法完全識別的情形下會自動提示專家進行人工干預。“單憑肉眼,很難分辨文字上的一些細微差異。”尹小林說,“如"礻"和"衤"、"曰"和"日"等,即使底本就在眼前,只怕也會誤認,但對于電腦而言,卻是完全不同的兩個編碼,識別起來絕無含糊。其實,比對的目的還是為了查錯,在這方面,電腦的優勢遠非人眼所能比擬。”

  新聞出版總署規定圖書出版質量標準為差錯率不得超過萬分之一。換作從前,這個標準很難得到徹底執行,但現在卻是輕而易舉。電子文獻研究所曾用智能版本比對系統抽查了部分古籍圖書,發現即便是權威出版社出版的權威版本,也有不合格者,更遑論其他普通版本。這一比對方法若能在今后的古籍校勘中加以效仿,相信定會從整體上提升古籍的出版質量。

  除了自動校勘,自動標點同樣是古籍整理工作者夢寐以求之事。而智能輔助標點系統的出現,讓這個夢想變得唾手可得,盡管還不完美,卻足以令人驚喜。借助該系統,不僅免除了許多無謂的重復勞動,還可以把節省下來的時間投入到更重要的研究中去,這無異于延長了學者的生命。為此,電子文獻研究所于年初啟動了文淵閣四庫全書版《二十四史》的整理工程,權作試點,若然可行,便推而廣之。他們的雄心壯志,是要最終完成文淵閣四庫全書的標點出版。此愿如能實現,誠乃中華文明之莫大幸事!我們將拭目以待。

  (二)GIS技術與文學地圖——他山之石,可以攻玉

  GIS即地理信息系統,如今廣泛應用于交通導航、城市規劃、資源調查、環境評估、災害預測、國土管理等幾乎各個領域。本質上,GIS也是一個數據庫,只不過儲存的是地理信息而已。因此,GIS對于古籍數字化必然有許多值得借鑒之處。

  受此啟發,武漢大學文學院教授王兆鵬在會上提出了一個大膽的構想——利用GIS技術整合靜態分散的文學史料,建立多功能的中國文學數字化地圖平臺。該平臺將具有資料查詢、數據統計、地圖生成等功能,既可以查詢中國古今文學家生平和作品中的重要信息,也可以進行分類統計,還可以用電子地圖來呈現統計結果。地圖可以顯示每個時間點和時間段,中國各個地方有哪些作家在此地出生、在此地過世、在此地活動和創作;更可以顯示一個作家生于何地(或所屬籍貫)、在哪些地方活動過,在哪些地方創作了哪些作品、跟哪些人一起交游互動并能按時間先后順序自動生成作家行蹤路線圖。

  這個構想是相當宏大和富有創意的,其核心框架還可以靈活套用在諸如歷史、哲學、宗教等其他學科領域,就好像民間故事中的母題,擁有被無限復制的潛力。平臺建成后,可以從時間和空間兩個維度上提供多種觀察文學的切口和視點,將很可能帶來文學研究范式的革命性變化。雖然目前這個構想還只停留在理論階段,并未付諸實施,但其遠大前景是完全可以預期的。

相關熱詞搜索:探討古籍數字化的窘境與生機

上一篇:走向融合 傳統出版與數字出版不必勢不兩立
下一篇:傳統通路的出版商和書店加入網上書店競爭

分享到: 收藏
主站蜘蛛池模板: 久久综合伊人77777 | 免费国产综合视频在线看 | 2020国产成人精品视频网站 | 五月天开心中文字幕 | 国产精品自拍亚洲 | 久久国产精品电影 | 不卡视频一区 | 久久婷婷人人澡人人爱91 | 奇米影视网 | 久久久久国产精品 | 高清视频免费看 | 蜜臀视频在线播放 | 久久国 | 九九这里只有精品 | 黄色的视频免费观看 | 91久久婷婷国产综合精品青草 | 婷婷综合在线 | 国产成人精品曰本亚洲 | 欧美专区视频 | 激情小说婷婷 | 啪啪网址免费网址 | 久久精品国产久精国产 | 91亚洲国产成人久久精品网站 | 国产一级毛片国产 | 亚洲欧美日韩综合一区久久 | 日韩理论电影2021第1页 | aaa级精品久久久国产片 | 久久99精品视频 | 男女下面一进一出视频在线观看 | 奇米第四色首页 | 开心激情网五月天 | 国产成人精品在线 | 久久精品99视频 | 四虎影院精品在线观看 | 免费的成年私人影院在线观看 | 色列里番不知火舞h本全彩无遮挡 | 久久国产成人精品国产成人亚洲 | 国产高清一级毛片 | 青春草在线观看播放免费视频 | 五月天激情啪啪 | 你懂的免费在线视频 |