Phoenix -修复表索引

news/2024/7/5 18:33:09
      • 索引的修复可以通过2种方式,(关于pehoenix的索引的生命周期可以参考  https://community.hortonworks.com/articles/58818/phoenix-index-lifecycle.html
        • 一 手工执行修复命令 
        • 依赖phoenix的自动修复命令
      • 自动修复
        • Phoenix 对于索引状态异常的情况,按照设计会自动进行修复的,也就是autorebuild,不过发现在HDP2.2 下,不能正常修复,后台(regionserver)提示找不到schema

          针对这个bug,社区已经反馈为HDP2.2的bug,在2.3版本已经修复.可以参考 https://community.hortonworks.com/questions/66446/phoenix-index-becom-unavaiable.html#comment-67349
      • 手工修复
        • 当数据量比较小的时候,正常的修复命令可以正常执行,但是由于数据量较大,出现了修复超时、修复错误等问题
        • 当数据量较大的时候,采用修复命令的时候,比较曲折,由于各方面原因最终没有修复成功,
      • 下面的一个场景为修复我们的一个数据库表原始数据800G,索引数据70个G左右,regionserver 是3台,8core 14g
      • 修复流程如下
      • 查看当前索引的状态
                                        select TABLE_NAME,DATA_TABLE_NAME,INDEX_TYPE,INDEX_STATE,INDEX_DISABLE_TIMESTAMP from system.catalog where INDEX_TYPE is not null

;


      验证sql 是否走索引 发现没有走

      
                            .修复索引

          • ALTER INDEX IF EXISTS SysActionLog_idx ON "SysActionLog" REBUIL3
      • 执行出现超时
              Error: org.apache.phoenix.exception.PhoenixIOException: Failed after attempts=36, exceptions:
        • Wed Nov 16 11:06:26 GMT 2016, null, java.net.SocketTimeoutException: callTimeout=60000, callDuration=73626: row '' on table 'SYSACTIONLOG_IDX' at region=SYSACTIONLOG_IDX,,1463835204579.ce4eb5993504052a305c8807d6234d93., hostname=workernode2.reddog.microsoft.com,16020,1479228656092, seqNum=1438608 (state=08000,code=101)
      • 再次查询。

      • 此时索引的状态已经 变为正在进行修复
  •                    修改phoenix 的执行超时(index.phoenix.querytimeout) ,后执行 再次 仍然出现错误

            •  

        6/11/16 11:40:40 WARN client.ScannerCallable: Ignore, probably already closed(region server 的日志对应的为超时)
        • org.apache.hadoop.hbase.UnknownScannerException: org.apache.hadoop.hbase.UnknownScannerException: Name: 5, already closed?
          •   at org.apache.hadoop.hbase.regionserver.HRegionServer.scan(HRegionServer.java:3186)
           at org.apache.hadoop.hbase.protobuf.generated.ClientProtos$ClientService$2.callBlockingMethod(ClientProtos.java:29994)
           at org.apache.hadoop.hbase.ipc.RpcServer.call(RpcServer.java:2080)
           at org.apache.hadoop.hbase.ipc.CallRunner.run(CallRunner.java:108)
          at org.apache.hadoop.hbase.ipc.RpcExecutor.consumerLoop(RpcExecutor.java:114
        at org.apache.hadoop.hbase.ipc.RpcExecutor$1.run(RpcExecutor.java:94)
         at java.lang.Thread.run(Thread.java:74

      5修改超时时间
                        针对上面的错误,分析regionserve的日志,发现是由于一些超时时间导致,在每个regionserver 的节点上增加如下参数
        • <property>
          <name>hbase.client.scanner.timeout.period</name>
          <value>9200000</value>
          </property>
          <property>
          <name>hbase.rpc.timeout</name>
          <value>9200000</value>
          </property>
          <property>
          <name>hbase.regionserver.lease.period</name>
          <value>9200000</value>
          </property>
          <property>
          <name>phoenix.query.timeoutMs</name>
          <value>9200000</value>
          </property>

    • 目前 怀疑 应该在HDInsight 节点下的phoenix 目录下的hbase-site.xml 增加上面的几个参数,但是原生的HDP下phoenix的目录下没有这个hbase-site.xml。 有时间进一步验证....  

    • 在Hdp 原生的集群执行时,也出现了超时,由于时微软的azure windows 平台上 不知HDP在window上是否有问题,同样的操作和参数配置 在测试的HDP liux集群出现了如下错误,需要进一步解决,(调整zk的时间)
  • 未完 待续

转载于:https://www.cnblogs.com/pbc1984/p/6069755.html


http://www.niftyadmin.cn/n/4638851.html

相关文章

《悟透JavaScript》(1)

引子编程世界里只存在两种基本元素&#xff0c;一个是数据&#xff0c;一个是代码。编程世界就是在数据和代码千丝万缕的纠缠中呈现出无限的生机和活力。数据天生就是文静的&#xff0c;总想保持自己固有的本色&#xff1b;而代码却天生活泼&#xff0c;总想改变这个世界。你看…

Docker容器centos、unbuntu 无法使用 systemctl 命令

报错内容&#xff1a; System has not been booted with systemd as init system (PID 1). Cant operate.Failed to connect to bus: Host is down意思是 &#xff1a; 1号进程不是 init &#xff0c;而是其他例如 /bin/bash &#xff0c;所以导致缺少相关文件无法运行。 解决…

什么是PXE?

PXE(preboot execute environment&#xff0c;预启动执行环境)是由Intel公司开发的最新技术&#xff0c;工作于Client/Server的网络模式&#xff0c;支持工作站通过网络从远端服务器下载映像&#xff0c;并由此支持通过网络启动操作系统&#xff0c;在启动过程中&#xff0c;终…

.sh 编写

2019独角兽企业重金招聘Python工程师标准>>> 1.常用符号 ./run.sh abc def //$0 是./run.sh 这个字符 echo hello $0 $1 $2 // $1 取出abc 的值 ,$2 ,取出第二个参数 $# // 参数的个数 $ // 第0个后面所有的参数 $1 // $n 第一个或者n个参数 $? // 上次命令执行命令…

什么是esxi?

ESXi 专为运行虚拟机、最大限度降低配置要求和简化部署而设计。只需几分钟时间&#xff0c;客户便可完成从安装到运行虚拟机的全过程&#xff0c;特别是在下载并安装预配置虚拟设备的时候。 安装设置 在服务器上安装ESXi主机&#xff0c;vSphere提供了几种方法:交互式、脚本、…

DVWA之SQL Injection/SQL Injection(Blind)

SQL Injection SQL语句基本知识 由于常见的注入类型为数字型和字符型(根据查询的字段值有无引号决定的) 可通过a’ or 1 1#或者a or 1 1#(a表示正确输入的值&#xff0c;#为注释)来判断注入类型。 若为数字型sql注入&#xff0c;前者报错或查询不到数据、后者可能查询到所有结…

sql server 自定义split 标值函数

自定义一个函数&#xff0c;分隔一个以分隔符的隔开字符串&#xff0c;例如把‘1,3,5,7,9’ 变成 数字1 3 5 7 9的结果集。 自定义标值函数&#xff1a; create function [dbo].[my_split](SourceSql varchar(8000),StrSeprate varchar(10)) returns temp table(a varchar(100)…

校招实习

实习怎么找 实习那些坑