广州工商学院;
目前,网购交易的日益增加使得电商数据量呈现疯狂增长的态势,数据量的大增需要引入数据仓库,用以支持对大容量数据的分析和处理。在数据仓库的架构设计过程中,将HDFS作为底层文件存储系统,避免因某些原因而导致的系统崩溃。该文对高可用数据仓库的应用进行深入的研究,通过搭建高可用数据数仓平台,解决Hadoop单节点故障问题,提高数据采集和存储的效率,有效解决了传统数据分析的局限性,具有一定的应用推广价值。
674 | 5 | 2 |
下载次数 | 被引频次 | 阅读次数 |
[1]邹群.一种基于Hadoop的数字图书存储系统设计方案[J].黑龙江史志,2014(1):212.
[2]翟永东.Hadoop分布式文件系统(HDFS)可靠性的研究与优化[D].武汉:华中科技大学,2011.
[3]李聪.HDFS元数据管理的高可用性优化技术研究[D].哈尔滨:哈尔滨工业大学,2016.
[4]宋继红,李梦楠,郝得智.基于Hadoop分布式文件系统的单点问题的研究[J].软件工程师,2014,17(12):9-10+6.
[5]杨帆.Hadoop平台高可用性方案的设计与实现[D].北京:北京邮电大学,2012.
[6]陈磊,吴晓晖.基于Hadoop的分布式集群大数据动态存储系统设计[J].中国电子科学研究院学报,2019,14(6):593-598.
基本信息:
DOI:10.19850/j.cnki.2096-4706.2023.01.027
中图分类号:TP311.13
引用信息:
[1]刘晓莉,李满,熊超等.基于Hadoop搭建高可用数据仓库的研究和实现[J].现代信息科技,2023,7(01):99-101.DOI:10.19850/j.cnki.2096-4706.2023.01.027.
基金信息:
广州工商学院2022年国家级大学生创新创业训练计划立项项目(202213714006)