PTQ4RIS: Post-Training Quantization for Referring Image Segmentation（PTQ4RIS：参考图像分割的训练后量化）

base模型

LAVT

对于视觉编码器，通过Softmax和GeLU的函数激活后分布明显偏离高斯分布，不适合使用唯一的比例因子。

对于文本编码器，有许多异常值。

方法

采用双区域量化方法分别量化两个范围内的激活。划分两个区域，R1和R2。

在softmax中将靠近0的数值划分到R1中，靠近1的数值划分到R2中。

在GeLU中将负值划分到R1中，正值划分到R2中。

计算SR1和SR2

固定SR2，基于Hessian矩阵的度量，搜索SR1，然后固定SR1搜索SR2。

方法

将激活值划分为不同的组，用不同的尺度因子对每组进行动态量化。对于量化友好的特征融合和解码器模块，我们直接采用了一种简单的统一量化方法。

步骤