TRS大数据处理平台解决方案2.0VIP专享VIP免费

下载本文档

阅读 95
下载 11
格式 pdf
大小 3.59 MB
约18页
2024-12-05 发布于天津市
收藏
评论
点赞(0)
海报
举报

/18

下载本文档

北京拓尔思信息技术股份有限公司 1 TRS 大数据处理平台解决方案 v2.0 越来越多的国内外互联网公司和传统企业都已意识到数据资产化和规模化带来的价值，低成本和高效率存储、处理、检索和分析 PB 乃至 EB 量级的数据成为极大挑战，向数据要价值使得几乎每个行业都面临着大数据问题。以 IBM、Oracle 和 EMC 代表的传统数据处理系统成本高、能耗高、扩展性差，而且将数据的存储、管理和计算孤立开来，难以同时实现大数据的全生命周期处理。需要研究成本低、能耗低、可扩展性强、存储与处理耦合协同的大数据处理新型体系架构，提高处理性能和效率，实现大数据规模效应下的数据可靠存储和高效处理。以 Hadoop 和 Spark 为代表的一系列开源技术，成为大数据存储、处理和分析的主力军。互联网企业广泛使用开源软件，但开源软件直接用于企业的大数据处理有很多挑战和困难，其主要原因在于需求、服务、研发和运维体系完全不同，从需求的角度，企业应用中业务逻辑复杂、数据来源和种类多样性、单一的大数据解决方案无法满足企业复杂的业务需求，同时企业信息系统对安全和系统可靠性要求很高。从成本的角度，企业用户也不可能雇佣大批高水平的研发人员来研发和运维基于开源的大数据应用系统。标准化的、安全和可靠性极高、满足自身复杂业务需求的大数据技术和产品仍然是企业用户的首要选择。检索引擎的功能和性能决定了大数据系统的响应能力和可用性，同时很多大数据分析和交互挖掘操作也依赖于底层的实时查询技术，因此在 PB 级数据规模、多源异构数据（结构化、半结构化、非结构化数据）的场景下，能够获得秒级甚至亚秒级响应成为一个大数据应用系统的关键指标 , 只有这样，才能保障复杂大数据的及时有效处理（规模大、变化快、种类杂、价值密度低）。此外 , 文本挖掘是提升非结构化数据分析效果的关键技术, 特别是中文文...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容