Where communities thrive


  • Join over 1.5M+ people
  • Join over 100K+ communities
  • Free without limits
  • Create your own community
People
Activity
    AUB
    @aubdiy
    java.lang.NoClassDefFoundError: Could not initialize class org.apache.hadoop.util.StringUtils
    有朋友遇到过吗
    doris 0.15, hadoop 3.3.1 hdfs-broker 在导入 hdfs 数据的时候 失败, 日志中提示 找不到类
    receive a ping request, request detail: TBrokerPingBrokerRequest(version:VERSION_ONE, clientId:172.31.3.146)
    [INFO ] 2022-02-08 08:07:10,947 method:org.apache.doris.broker.hdfs.HDFSBrokerServiceImpl.listPath(HDFSBrokerServiceImpl.java:67)
    received a list path request, request detail: TBrokerListPathRequest(version:VERSION_ONE, path:hdfs://test.internal:8020/tmp/data.csv, isRecursive:false, properties:{_DORIS_STORAGE_TYPE_=BROKER})
    [INFO ] 2022-02-08 08:07:10,948 method:org.apache.doris.broker.hdfs.FileSystemManager.getDistributedFileSystem(FileSystemManager.java:244)
    create file system for new path: hdfs://test.internal:8020/tmp/data.csv
    Exception in thread "pool-2-thread-13" java.lang.NoClassDefFoundError: Could not initialize class org.apache.hadoop.util.StringUtils
        at org.apache.hadoop.conf.Configuration.getBoolean(Configuration.java:1437)
        at org.apache.hadoop.fs.FileSystem.get(FileSystem.java:369)
        at org.apache.doris.broker.hdfs.FileSystemManager.getDistributedFileSystem(FileSystemManager.java:360)
        at org.apache.doris.broker.hdfs.FileSystemManager.getFileSystem(FileSystemManager.java:152)
        at org.apache.doris.broker.hdfs.FileSystemManager.listPath(FileSystemManager.java:427)
        at org.apache.doris.broker.hdfs.HDFSBrokerServiceImpl.listPath(HDFSBrokerServiceImpl.java:74)
        at org.apache.doris.thrift.TPaloBrokerService$Processor$listPath.getResult(TPaloBrokerService.java:815)
        at org.apache.doris.thrift.TPaloBrokerService$Processor$listPath.getResult(TPaloBrokerService.java:795)
        at org.apache.thrift.ProcessFunction.process(ProcessFunction.java:38)
        at org.apache.thrift.TBaseProcessor.process(TBaseProcessor.java:38)
        at org.apache.thrift.server.TThreadPoolServer$WorkerProcess.run(TThreadPoolServer.java:313)
        at java.base/java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1128)
        at java.base/java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:628)
        at java.base/java.lang.Thread.run(Thread.java:834)
    [INFO ] 2022-02-08 08:07:10,963 method:org.apache.doris.broker.hdfs.HDFSBrokerServiceImpl.listPath(HDFSBrokerServiceImpl.java:67)
    received a list path request, request detail: TBrokerListPathRequest(version:VERSION_ONE, path:hdfs://test.internal:8020/tmp/data.csv, isRecursive:false, properties:{_DORIS_STORAGE_TYPE_=BROKER})
    Red12345678
    @Red12345678
    image.png
    有朋友遇到过吗,能否请教如何修复
    JiangJungle
    @JiangJungle
    doris可以跨集群搜索吗
    airfreshchen
    @airfreshchen
    用Doris做标签圈人,以标签为主键做聚合操作,导致单个标签上的userId过多,如何将userId
    用Doris做标签圈人,以标签为主键做聚合操作,导致单个标签上的userId过多,如何将userId行转列导出 有什么好办法吗
    需要自己开发UDTF函数 还有其他什么好办法吗
    kevinliukai
    @kevinliukai
    max_conn_per_user这个参数可以动态设置吗
    deemogsw
    @deemogsw
    有没有大佬使用了doris on es,建外部表的。我目前的需求是画像大宽表想要关联其他小表做人群生成预览,本来想每日同步数据进doris,但是同步时间比较长,卡在早高峰会使预览功能不可用。想做es外部表,宽表数据本身就在es中,只要把小表数据同步到doris,然后再关联es外部表count。看了下官网描述不知道这种join的操作谓词还能不能下推到es查询了。
    jiuqinyan
    @jiuqinyan
    刚入门,看了一下官方文档,并没有说mysql全量导入到doris中的解释,增量倒是有binlog,求大佬解惑
    King0513
    @King0513
    全量导入用dataX或者外部表直接查询。
    luzhijing
    @luzhijing

    doris可以跨集群搜索吗

    不支持

    用Doris做标签圈人,以标签为主键做聚合操作,导致单个标签上的userId过多,如何将userId行转列导出 有什么好办法吗

    下个版本支持Lateral View

    有没有大佬使用了doris on es,建外部表的。我目前的需求是画像大宽表想要关联其他小表做人群生成预览,本来想每日同步数据进doris,但是同步时间比较长,卡在早高峰会使预览功能不可用。想做es外部表,宽表数据本身就在es中,只要把小表数据同步到doris,然后再关联es外部表count。看了下官网描述不知道这种join的操作谓词还能不能下推到es查询了。

    支持

    jiuqinyan
    @jiuqinyan
    image.png
    image.png
    用es做外部表的时候报连不上,但是ip却不是建表的ip?
    Jw9394
    @Jw9394
    大家好,我有8台服务器16c 256G SSD16T想要部署BE,请问每一台应该部署几个BE示例比较好?
    ziliang-wan
    @ziliang-wan
    大家好,有没有遇到过doris集群通过broker备份快照到hdfs的时候报 could only be replicated to 0 nodes instead of minReplication (=1). There are 1 datanode(s) running and 1 node(s) are excluded in this operation. 的,同一个hadoop,另外一套doris集群可以正常做备份。
    wanhuhou
    @wanhuhou
    Rollup. 创建的个数有没有限制,因为没办法判断用户使用什么字段查询,所以想创建多个来提高不同的查询条件
    luzhijing
    @luzhijing

    大家好,我有8台服务器16c 256G SSD16T想要部署BE,请问每一台应该部署几个BE示例比较好?

    建议1台机器部署1个BE

    Rollup. 创建的个数有没有限制,因为没办法判断用户使用什么字段查询,所以想创建多个来提高不同的查询条件

    可以创建多个,没有数量限制,但是存在多个物化视图时可能会影响写入或删除的效率

    wanhuhou
    @wanhuhou
    分区多的表创建太慢 有办法优化吗
    prestigeoscar
    @prestigeoscar
    image.png
    image.png
    fe的master启动后,过不了多久就自动挂。看日志也看不懂,可以帮忙分析一下吗?
    prestigeoscar
    @prestigeoscar
    image.png
    每次启动的报错都会出不一样的东西
    prestigeoscar
    @prestigeoscar
    image.png
    添加新的节点也会搞挂master
    tsj68
    @tsj68
    各位大佬,请教一个问题,在doris创建hive外表的时候提示:Error Code: 1064. errCode = 2, detailMessage = Unknown engine name: hive,doris版本:12.17,是否这个版本不支持?
    Level1Accelerator
    @Level1Accelerator
    各位大佬,关于rpc udf的问题,protobuf应该用啥版本啊
    Level1Accelerator
    @Level1Accelerator
    生成的java类都没有PFunctionServiceGrpc,只有FunctionService,Types,不知道跟版本有没有关系
    PRNDA(A for Auto)
    @PRNDA
    INSERT INTO 到底是否适合导入大量数据?我看两个不同的地方的说明是互相矛盾的
    image.png
    doris 官网上显示是 “Insert Into 对数据量没有限制,大数据量导入也可以支持”
    http://doris.incubator.apache.org/zh-CN/administrator-guide/load-data/insert-into-manual.html#%E5%88%9B%E5%BB%BA%E5%AF%BC%E5%85%A5
    但是百度自己的palo官网上又写着“ODBC 外部表本质上是通过单一 ODBC 客户端访问数据源,因此并不合适一次性导入大量的数据”
    http://palo.baidu.com/docs/%E6%93%8D%E4%BD%9C%E6%89%8B%E5%86%8C/%E6%95%B0%E6%8D%AE%E5%AF%BC%E5%85%A5/%E9%80%9A%E8%BF%87%E5%A4%96%E9%83%A8%E8%A1%A8%E5%90%8C%E6%AD%A5%E6%95%B0%E6%8D%AE
    Hans Van Akelyen
    @hansva
    Hello Doris Friends, I was wondering if there is a docker image available to do some testing against.
    Or is the best solution downloading the Binary release for 1.0.0?
    Thanks for the feedback!
    lin9long
    @lin9long
    5台be服务器,其中一台be服务器磁盘损坏后,重新部署doris的be后启动,启动无报错,但过一段时间后,随机选择一台be服务器会挂掉,日志报错Got error while opening fragment 65166ac53ca04fd9-8d3c1ad5931eb5be: Cancelled: Cancelled,有时候在finebi用in的子查询无法查出分区数据,如(partition_date in date('2022-05-01')),麻烦各位大佬帮忙看下,谢谢。
    itontheway
    @itonway
    Doris1.0.0 查询外部表
    Don't support MySQL table, you should rebuild Doris with WITH_MYSQL option ON
    SunYang
    @sun-iot
    有个小小的问题,就是在 Druid 里面的一个维度字段用到了 hyperUnique,那这个要是想迁移到 Doris,对这个字段要怎么处理呢?
    jiafeng.zhang
    @hf200012

    移除依赖库 [1] 会导致无法访问 MySQL 外部表。访问 MySQL 外部表的功能会在后续版本中通过 UnixODBC 实现。

    移除依赖库 [2] 会导致在无法读取部分早期版本(0.8版本之前)写入的部分数据。因为早期版本中的数据是使用 LZO 算法压缩的,在之后的版本中,已经更改为 LZ4 压缩算法。后续我们会提供工具用于检测和转换这部分数据。

    如果有需求,用户可以继续使用这两个依赖库。如需使用,需要在编译时添加如下选项:

    WITH_MYSQL=1 WITH_LZO=1 sh build.sh

    建议使用odbc
    @lin9long 这个问题磁盘损坏,不需要重新部署be,只需要在be里将这个磁盘配置去掉,重启be即可
    @itonway 你这个如果是with mysql,需要你自己编译,否则使用odbc
    @PRNDA odbc不适合一次性从mysql导入大量数据,insert into select 如果在doris内部,数据量无所谓
    jiafeng.zhang
    @hf200012
    @hansva yes,the best solution downloading the Binary release