千变万化

芯算未来

AI计算IP核 IP Core

Mobilenet-SSD

计算存储资源可分配

内部存储支持

支持

深度:可调(32bit MAX)
宽度:自适应调节(128~512bit)

MAC阵列尺寸

INT8

INT16

FP16

FP32

位宽可调节

≥ 64x64

支持数据类型

Conv

Pooling

ReLU

Concat

支持算子类型

Max pooling

Pooling类型

2^N (512bit MAX)

对应模型典型Latency

@200MHz 

1.71ms

Inception-v2

ResNet50

BERT

高精度量化能力

支持

支持

深度:可调(32bit MAX)
宽度:自适应调节(128~512bit)

INT8

INT16

FP16

FP32

Max,Ave /3x3 5x5 7x7 9x9

2^N (512bit MAX)

≥ 64x64

Conv

Pooling

ReLU

Concat

BatchNorm

15.52ms

支持

支持

深度:可调(32bit MAX)
宽度:自适应调节(128~512bit)

INT8

INT16

FP16

FP32

Max,Ave /3x3 5x5 7x7 9x9

2^N (512bit MAX)

≥ 64x64

Conv

Pooling

ReLU

Concat

Scale

支持

深度:可调(32bit MAX)
宽度:自适应调节(128~512bit)

INT8

INT16

FP16

FP32

2^N (512bit MAX)

≥ 64x64

Matrix

Embedding

Linear

LayerNorm

17.1ms

支持

32.79ms

支持

产品参数

支持多种数据类型,量化精度高

存算一体,低延时,高能效比

参数可调节,部署更灵活

可重构架构,支持算子种类多,模型兼容性强

▪    Fully-connected layers

▪    Dilated convolutions

▪    Max pooling, Average Pooling

▪    ReLU, GeLU

▪    Matrix Multiplications

▪    位宽可调节

▪    计算MAC资源可调节

▪    存储资源可调节

▪    INT8,  INT16, FP16, FP3

▪    单模型支持各层不同精度量化

▪    单模型支持各层不同精度量化

▪    高算力密度,高能效比

▪    低外存访问,低延时