| 缘起 |
联合知识库为联合线上公司于2000年4月筹备,2001年2月19日正式成立的新媒体。联合报系所发行的联合报、经济日报、民生报(民生报资料至2006/11/30止)、联合晚报及星报(星报资料至2006/10/31止)等五大报在过去五十年来共发行了一百卅万个报纸版面、一千多万则新闻、七十余亿个字。这些新闻资产正是台湾民众过去五十年生活的共同记忆,它不止是文字资料,而是历史的轨迹与验证。
如何将这些重要的社会资产与全体华文社会共享,一直是联合报系长期以来认真思考的议题,当因特网普及后藉由数位化的科技,这个理想得以实现。联合知识库的成立不仅提供了新闻资料的检索更衍生了数位典藏历史的社会责任,活化报系五十年的新闻资料,完整而详实地呈现台湾近代珍贵史料,累积社会事实,传递文化变迁的轨迹,成为新世纪知识的库藏中心,并提供完善的知识管理工具,落实打造知识社会的基础工程。 |
| a |
| 报纸数位化工程 |
| 当联合报系政策决定执行报系五十年来报纸数位化的跨世纪工程时,首先面临的问题是五十年来报纸的纸质、排版、印刷历经多次技术革新,且拥有非常庞大的资料量,当前市场上并没有单一自动化的技术可以满足报系数位化工程的需求。联合知识库集成了多种技术开发出高效率的资料回溯系统,首先委托毅欣公司进行整版扫瞄,再将字体、字型变化较多,计算机不易辨识的标题用人工输入,接着以图文切割的方式将报纸版面上的内容分区切块透过全景软件公司为联合知识库打造的多核心光学图象辨识系统(OCR)将图象档转换为文字档保存,在此阶段文字的正确率已可达到百分之九十八以上,为了提高正确率全景公司还提供集字校对与逐字校对工具,透过两次「半人工、半自动」的循环校对后正确率提高到百分之九十九点九一。此项庞大的数位化工程除了藉助以上各技术来源外,并由联合报系印务部及校对中心同仁支持完成。
联合知识库当前提供联合报系包括已回溯完成联、经、晚三报;及民(民生报资料至2006/11/30止)、星(星报资料至2006/10/31止)、Upaper等六报共九百余万则新闻资料。 |
| |
| 图象图片保存 |
| 在多媒体发达的时代,计算机的保存、内存设备,已趋向便宜普及化,使用者的信息需求也由单纯的文字,进而发展至更精致的图片,联合知识库除了致力于文字资料的回溯之外,也于2004年2月推出图象图库的服务,由多位专业的编辑将报系珍贵的照片资料数位化,重新整理分类,提供使用者更多的信息。未来,图象图库的目标则是将联合报系五十年来的珍贵史料照片,以人工扫描重新整理的方式将之数位化,用图像的方式更具体呈现出台湾社会、历史人物的原貌。 |
| |
| 主要功能、关键技术 |
| 在信息爆炸的时代里建置数据库的主流方向为「Metadata」意指「诠释资料」或「超资料」它的基本理念是「data
about data」,也就是说要将资料重新分析组织整理,以提升资料的附加价值让使用者容易消化吸收便能转换为知识。联合知识库除了拥有联合报系五十年的新闻资料外更要提供各种先进的技术来活化这些资料,让使用者能够很方便的诠释资料、撷取知识。为了成为完美的知识管理工具,联合知识库供应以下五大主要功能与服务。
|
| |
| |
| 会员类型与服务 |
| 联合知识库为一收费型网站,「知识有价,使用者付费」的观念逐渐为网络使用者所接受,联合知识库提供各种会员不同的服务内容,并依不同的会员身份赠送不同的储值点数,使用者在阅读30天以前的新闻内文时系统就自动扣除一点储值点数。 |
| 各类型会员的服务与收费如下表: |
| | 全文检索 |
专卷查询 |
报版浏览 | 我的剪报 |
图象图库 | 自动剪报系统 |
| 非会员 |
近10年的标题检索
近7天的新闻全文 |
无法使用 |
无法使用 |
无法使用 |
无法使用 |
无法使用 |
| 免费会员 |
近10年的标题检索
近30天的新闻全文 |
无法使用 |
无法使用 |
无法使用 |
无法使用 |
无法使用 |
精点会员
200元 |
联合报系全部的资料
20点储值点数 |
可使用 |
可使用 |
无法使用 |
可使用 |
无法使用 |
| 学生会员 600元
| 联合报系全部的资料 200点储值点数
|
可使用 |
可使用 |
可使用 |
可使用 |
无法使用 |
| 菁英会员 2,000元
| 联合报系全部的资料 400点储值点数
|
可使用 |
可使用 |
可使用 |
可使用 |
无法使用 |
| 企业会员 20,000元 |
联合报系全部的资料 4000点储值点数 |
可使用 |
可使用 |
可使用 |
可使用 | 可使用 |
|
| *另不定期推出各项优惠的合购案,请注意联合知识库首页的活动内容! |
| |
| 基本资料 |
| |