请问在 hue 上用 hive 查询数据后导出 CSV 乱码怎么解决?

问答 歌唱祖国 ⋅ 于 2018-01-03 12:44:03 ⋅ 最后回复由 青牛 2018-01-03 17:12:24 ⋅ 11473 阅读

file

成为第一个点赞的人吧 :bowtie:
回复数量: 14
  • 青牛 国内首批大数据从业者,就职于金山,担任大数据团队核心研发工程师
    2018-01-03 13:19:01

    先去服务器上执行hive的命令看看导出的文件是不是乱码,hive默认导出的文件都是UTF-8的。

  • 歌唱祖国 不要跟过去的自己比,要期待未来的自己,珍爱现在的自己。
    2018-01-03 13:23:25

    @青牛 我导出excel文件xlsx,limit 10条,看到excel文件是正常的,只有csv是乱码,但是excel文件大数据不能导出,hue页面直接是等待超时,请问大神有命令行导出excel吗?能否告知小弟

  • 青牛 国内首批大数据从业者,就职于金山,担任大数据团队核心研发工程师
    2018-01-03 13:36:39

    @歌唱祖国 csv不就能用excel打开吗?你导出csv不就行了吗?
    如果非要转换的话你可以看看python的xlrd和csv模块,写个python脚本直接调用就可以当命令去使用的,不过数据太大速度也不会快

  • 歌唱祖国 不要跟过去的自己比,要期待未来的自己,珍爱现在的自己。
    2018-01-03 13:51:41

    @青牛 是csv用excel打开中文是乱码,xlsx用excel打开没乱码,但是xlsx不能导出数据量比较大的.导出的csv的数据有14M多,导出很快但是xlsx就有问题,不能导出。

  • 歌唱祖国 不要跟过去的自己比,要期待未来的自己,珍爱现在的自己。
    2018-01-03 13:54:45

    @青牛

    file
    用utf-8在hive上是正常的

  • 青牛 国内首批大数据从业者,就职于金山,担任大数据团队核心研发工程师
    2018-01-03 13:55:20

    @歌唱祖国 我的意思是你导出csv再转成excel

  • 歌唱祖国 不要跟过去的自己比,要期待未来的自己,珍爱现在的自己。
    2018-01-03 14:05:24

    @青牛 乱码的csv转成excel的格式还是乱码的

    file

  • 青牛 国内首批大数据从业者,就职于金山,担任大数据团队核心研发工程师
    2018-01-03 14:15:50

    @歌唱祖国 先让CVS不乱码,转换成excel的时候再调使用转换工具输出的编码

  • 歌唱祖国 不要跟过去的自己比,要期待未来的自己,珍爱现在的自己。
    2018-01-03 14:21:38

    @青牛 我现在就是想问导出csv如何不乱码啊,我现在目标文件就是csv

  • 青牛 国内首批大数据从业者,就职于金山,担任大数据团队核心研发工程师
    2018-01-03 15:55:08

    @歌唱祖国 去控制台上用vim查看一下文件的编码吧,在vim中使用命令:set fileencoding

  • 歌唱祖国 不要跟过去的自己比,要期待未来的自己,珍爱现在的自己。
    2018-01-03 16:03:18

    @青牛 直接在网页上导出到Windows的

  • 青牛 国内首批大数据从业者,就职于金山,担任大数据团队核心研发工程师
    2018-01-03 16:32:04

    @歌唱祖国 那就用软件看一下文件的编码比如notepad++

  • 歌唱祖国 不要跟过去的自己比,要期待未来的自己,珍爱现在的自己。
    2018-01-03 17:00:21

    @青牛 谢谢你,我用UltraEdit打开是正常的,我另存为一遍并设置UTF-8就可以用excel正常打开了,没有乱码了

  • 青牛 国内首批大数据从业者,就职于金山,担任大数据团队核心研发工程师
    2018-01-03 17:12:24

    @歌唱祖国 恩,有的时候不是文件是乱码的,而是打开的方式使用的编码不对让人觉得文件乱码了。

暂无评论~~
  • 请注意单词拼写,以及中英文排版,参考此页
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`, 更多语法请见这里 Markdown 语法
  • 支持表情,可用Emoji的自动补全, 在输入的时候只需要 ":" 就可以自动提示了 :metal: :point_right: 表情列表 :star: :sparkles:
  • 上传图片, 支持拖拽和剪切板黏贴上传, 格式限制 - jpg, png, gif,教程
  • 发布框支持本地存储功能,会在内容变更时保存,「提交」按钮点击时清空
Ctrl+Enter