WEB开发之电影数据库的设计与实现文献综述

 2022-08-02 15:34:38

文献综述

随着计算机科学的发展,数据库技术在Internet中的应用越来越广泛,数据库在网站的建设中已经成为必不可少的重要内容。可以说数据库技术已经成为网络的核心技术,网络就是数据库。

所谓数据,通常指用符号记录下来的、可以识别的信息。信息与数据之间存在着固有的联系:数据是信息的符号表示或称为载体;信息则是数据的内涵,是对数据语义的解释。
数据库是长期存储在计算机内、有组织的、统一管理的相关数据的集合。数据库能为各种用户共享,具有较小冗余度、数据间联系紧密而又有较高的数据独立性等特点。
数据库技术是研究数据库的结构、存储、设计、管理和使用的一门软件学科。

1,基于图数据库的电影推荐系统的设计与实现 刘东华

随着互联网技术的不断发展,信息过载越来越严重,想从网络中获取对自己有用的信息越来越难,但同时也越来越重要。搜索引擎虽然能在一定程度上帮助用户从海量信息中寻找自己需要的信息,却不能完全解决信息过载的问题,当用户无法准确描述自己所需要的信息时,就需要借助推荐系统来帮助用户从大量信息中寻找对用户有价值的信息。在多媒体领域,用户同样面临着如何从大量的电影中找到自己真正喜欢的电影,所以个性化电影推荐的研究对于解决当前电影领域内信息过载具有非常重要的价值和意义。 在此背景下,本文基于经典的用户协同过滤算法,进行了结合加权分类的混合式推荐算法的研究。首先,本文分析了当前推荐系统中普遍使用的各种算法,包括经典的内容过滤、基于用户或物品的协同过滤等算法,并分析比较各自的利弊。其次,结合电影自身的特点,提出一种通过为电影的分类赋予一定的权值,分析用户的历史评分数据,挖掘用户对特定分类的潜在偏好信息,然后配合基于用户的协同过滤算法组合成一种混合式电影推荐的改善算法。最后利用MovieLens的数据集,设计和实现了一个基于加权分类和用户协同过滤算法的混合式推荐演示系统,该系统以Spring Boot以及Spring Data Neo4j为基础框架,以Neo4j图形数据库存储和处理数据为核心,通过Web的方式用图形化界面展示推荐结果。 本文提出的算法对电影推荐系统的研究具有一定的参考价值,为分类赋予一定权值的思想可运用在其他上下文信息上或其他领域内的推荐系统中,最后实现的系统也可以作为相关推荐系统的演示系统。

2,中国电影世界多媒体数据库建设探析 樊晓红

信息资源数字化与网络化给图书馆的馆藏模式、 数据库建设、 收藏重点和资源共享等方面的深刻影响使得图书馆的馆藏已不再局限于印刷型文献, 电子版文献数量逐渐增加, 网上数字化文献也成为馆藏的重要组成部分;馆藏建设无须再追求 “ 大而全” 或 “小而全” , 而是各个图书馆应根据自身馆藏资源优势有目的有重点地进行深层次、 多方面有效开发及知识整合, 建成各具特色、 内容丰富、 类型完整、 层面深入的专题文献数据库, 以满足广大用户对信息内容全方位、 多角度的需求。 基于上述指导思想, 我馆从市场需求、 数据库建设成本、 馆藏资源优势、 社会效益、 经济效益等诸多方面进行论证, 提出建设 “ 中国电影世界多媒体数据库” 的构想, 即借助先进的信息技术处理手段将有关中国电影的声频、 视频、 图像、 文字等媒体资料进行数字化转换、 编辑、 压缩等处理, 以全新方式和角度展现中国电影艺术的独特魅力, 同时该数据库要具有对文献特征的揭示、 相关资料的阅览、 精彩片段的欣赏、 网上的即时点播等功能, 用户不仅可以欣赏色彩斑斓的精彩画面, 享受生动逼真的视听效果, 更能获得丰富详实权威准确的信息内容, 从而使中国电影世界多媒体数据库达到集思想性、艺术性、 知识性、 娱乐性于一体的使用效果。 这是我馆在网络环境下加快馆藏资源数字化建设, 特别是加快非书资料数字化 (如 CD 、 LD 、 VCD 、 DVD)建设, 缓解图书馆网站建设中多媒体数字信息资源匮乏与用户需求不断增长这一矛盾所进行的一项具有现实意义的工作。

中国电影世界多媒体数据库数据模型和检索机制的建立

由于多媒体信息具有数据量大, 信息长度不定, 信息种类繁多, 非结构化数据 (如图形、 图像和声音等)和结构化数据 (文字和数值信息)并存, 同时音频视频等媒体具有敏感性复合性等特点, 使得不同信息类型数据的组织和管理要比传统单一的数据管理复杂得多, 如何对多种媒体信息进行数字化转换与表现, 组织多种媒体信息素材成为相互关联相互集成的信息系统, 首先要确定多媒体数据库的数据模型。目前实现多媒体数据库系统管理较为常用的数据模型是在传统关系数据库基础上加以扩充, 即通过增加字段存放多媒体文件路径和文件名, 而多媒体信息本身则通过目录树的结构进行组织和管理, 这种数据库系统既保留了传统关系数据库对结构化常规数据的高效访问、安全管理等优点, 又扩充了支持多媒体和用户自定义数据类型存储的灵活性, 实现了多媒体信息与常规数据的一体化定义、 一体化存贮和一体化管理。 我馆采用的 ILAS Ⅱ 图书自动化系统也具备了对多媒体数据管理的功能, 它以国际互联网通用的 UNIX 操作系统为开发平台, 采用客户机/服务器 (C S)系统结构, 新增的 856 字段可以实现书目记录向全文、 多媒体电子资源的链接。 因此中国电影多媒体数据库的数据模型只需在原有书目数据基础上加以扩充,通过新增 856 字段存放多媒体数据文件路径和文件名, 而对于多媒体数据则按照文件目录分级方式存储在硬盘的发布文件夹下以外挂文件方式实现多媒体数据的资源管理。这种多媒体数据模型由于采用了 856 字段进行数字化资源链接, 实现了馆藏数字化信息资源的书目控制, 因此用户只需通过统一界面就能查询书目、 全文, 并对声音、 图像、 文字等多媒体信息进行无缝化、 集成化检索, 改变了传统 究资源与数字化资源彼此独立、 互无关联的局面, 为读者利用各种相关信息资源提供了极大地便利条件, 保证了数据资源建设的标准化和可迁移性。 其次多媒体数据库组织利用的关键是建立多渠道的检索途径和良好的检索机制, 它将直接影响数据的检索效果, 因此根据电影多媒体数据库特点我们不但提供题名、 责任者、 主题、 分类等常规检索,用户还可自行建立任意字段、 子字段, 如还提供其它题名(并列题名、 补充题名、 翻译题名)、 年代、 出版发行者、其他重要责任者 (编剧、 指挥)等辅助检索及各项相互间的 “与” 、 “ 或” 、 “ 非” 的逻辑组配检索, 这种查询方式和检索点的确定不但揭示了文献表层的特征属性, 还反映出文献深层主题特征, 基本满足了用户对多媒体数据库全面、准确、 求精、求细查询的要求。

3,参考文献

[1]刘东华. 基于图数据库的电影推荐系统的设计与实现[D].云南大学,2015.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版