青牛主题列表_海汼部落 | IT学习->实战为王

创始人

青牛

第 12 位会员

451 关注者

2256 评论

308 话题

WeChat
Website
公司
城市

Hadoop 环境部署？

我们这边用的是centos5.7比较新，hadoop用的是apache 2.7。3自己编译的，如果你非想用CDH的那就下个2.X最新版的就行。你可以搞这篇笔记去准备自己的集群环境
http://hainiubl.com/topics/176
大数据如何可视化？

有很多现成的报表工具，比如hue或者easyreport，可以生成报表和图表
常见的大数据交互方式有哪些？

@Xibaibai 你理解错了，我的意思是mysql中只存结果，比如最终的统计值，大的数据集还是不要存在mysql中
hadoop 集群问题？

不需要，因为节点之间的数据传输和ssh没有关系了，那个版本都好装，你不会编译就找别人编译好的，会就自己编译一个再装，给你一个hadoop源码编译教程参考一下http://hainiubl.com/topics/82
Hadoop 提取数据？

可以使用sqoop或者把表export成文件再上传到hdfs上，flume也能做方式很多，最方便的是直接导出文件的形式上传因为这样你不用安装其他的任何工具
yarn 任务 ACCEPTED 状态，查看日志如下，大神知道怎么回事吗？

看日志你需要启动yarn的proxyserver服务
如果是看mr任务的日志你还需要启动historyserver服务
常见的大数据交互方式有哪些？

@水墨之风目前来看，我还是建议把算好的数据放到mysql中的方式，目前的大数据解决方案对大量的数据查询速度都达不到从关系数据库中直接查询的速度。
常见的大数据交互方式有哪些？

如果数据量小的话可以，数据量大的话那用户等待时间长，就体验太差了。用户的忍耐度有一个3秒定论。当然如果是企业内部使用的话，即使用spark去查太大的数据量。也会有较长的等待时间，自己内部员工使用还凑合，不过要是你领导使用的话那他就不干了。:joy:
请问在 hue 上用 hive 查询数据后导出 CSV 乱码怎么解决？

@歌唱祖国恩，有的时候不是文件是乱码的，而是打开的方式使用的编码不对让人觉得文件乱码了。
请问在 hue 上用 hive 查询数据后导出 CSV 乱码怎么解决？

@歌唱祖国那就用软件看一下文件的编码比如notepad++
我一直不明白 MongoDB 的使用场景有哪些？

@ling775000 不同的解决方案而已，用MemcacheDB的地方也可以用hbase替代，但对比redis。对大数据的操作更友好，比如读取和写入。技术都有替代品而不是非得用那个，选择自己适合自己场景的。
我一直不明白 MongoDB 的使用场景有哪些？

需要：大缓存、KV存储并实时查询、要求可动态扩展，简单的说是需要nosql的场景，再简单的讲你可以理解成一个不受内存限制的大map
请问在 hue 上用 hive 查询数据后导出 CSV 乱码怎么解决？

@歌唱祖国去控制台上用vim查看一下文件的编码吧，在vim中使用命令:set fileencoding
请问在 hue 上用 hive 查询数据后导出 CSV 乱码怎么解决？

@歌唱祖国先让CVS不乱码，转换成excel的时候再调使用转换工具输出的编码
请问在 hue 上用 hive 查询数据后导出 CSV 乱码怎么解决？

@歌唱祖国我的意思是你导出csv再转成excel