About 51 results
Open links in new tab
  1. HBase 和 Hive 的差别是什么,各自适用在什么场景中? - 知乎

    1. Hive中的表是纯逻辑表,就只是表的定义等,即表的元数据。 Hive本身不存储数据,它完全依赖HDFS和MapReduce。 这样就可以将结构化的数据文件映射为为一张数据库表,并提供完整的SQL …

  2. hive到底是什么?做什么用的?在hadoop生态圈中到底是个什么角色? …

    Hive 是建立在 Hadoop 上的 数据仓库 基础构架。对于有一定基础的 大数据学习 者来讲,Hive是必须掌握的核心技术。 推荐教程: 2023新版大数据入门到实战教程,大数据开发必会的Hadoop、Hive, …

  3. 大数据之hadoop / hive / hbase 的区别是什么?有什么应用场景? - 知乎

    2. Hive Hive是一个基于Hadoop的数据仓库系统,它将SQL语言转化为MapReduce任务,并在Hadoop集群上运行。 它提供了类似于SQL的查询和分析接口,使得非专业开发人员可以通过简单的SQL语句 …

  4. 请问spark和hive是什么关系? - 知乎

    再来看看hive。 hive 官网有描述,“Apache Hive data warehouse software facilitates reading, writing, and managing large datasets residing in distributed storage using SQL.”,hive的定位是数据仓库,其 …

  5. 大佬们学hive要先学学hadoop 吗? - 知乎

    hive是给有SQL基础的人使用的,hadoop是整个生态圈的基础,也是 hive 的基础,离开hadoop就没有hive了,所以要想走的远的话,hadoop还是需要学习的,至于哪个先,哪个后,个人认为关系不大 …

  6. 基于hive的数据仓库如何处理数据更新(update)问题? - 知乎

    Mar 15, 2018 · 3) Hive的执行延迟比较高,因此Hive常用于数据分析,对实时性要求不高的场合。 4) Hive优势在于处理大数据,对于处理小数据没有优势,因为Hive的执行延迟比较高。 5) Hive支持用 …

  7. hive 如何优化查询速度? - 知乎

    Hive 优化查询速度的方法有很多,你可以记下: 使用分区表和分桶表: 合理的分区和分桶可以大大减少查询数据量,提高查询效率。 避免使用 select *: 尽量只选择需要的列,避免查询不必要的数据, …

  8. hive建表的location问题? - 知乎

    hive建表提供localtion的作用在于这种场景: 如果数据已经存在于HDFS上,并且这些数据已经有其他人在使用了,没办法改变数据文件格式和位置,所以这个时候建表,就要使用extend表,并且指 …

  9. 没去过大公司如何学hive? - 知乎

    hive的元数据存储在关系数据库里,支持derby、mysql两种关系型数据库。 元数据对于hive十分重要,因此Hive支持把metastore服务独立出来,安装到远程的服务器集群里,从而解耦hive服务和metastore …

  10. 对比hive on spark,sparksql的优势有哪些? - 知乎

    而spark on hive的话,Spark通过Spark-SQL使用hive 语句,操作hive,底层运行的还是 spark rdd。 通过sparksql,加载hive的配置文件,获取到hive的元数据信息;spark sql获取到hive的元数据信息之后 …