Skip to content

希望支持静态量化模型(AWQ/GPTQ,配合llmc)的加载与推理 #894

@poisonwine

Description

@poisonwine

Hi LightLLM 团队,
感谢你们提供高效、轻量的推理框架。希望未来可以支持以下feature

  • 支持HuggingFace 上常见的 AWQ/GPTQ 静态量化模型推理(例如qwen系列的awq模型)。
  • 支持你们团队 LLMC 量化模型的原生加载和推理

这两个特性对于部署是非常节省时间和友好的,再次感谢你们的工作。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions