JinaAI
约 265 字小于 1 分钟
2025-02-24
Jina AI 成立于 2020 年,是一家领先的搜索 AI 公司。我们的 搜索底座 平台包含了向量模型、重排器和小语言模型,可帮助企业构建可靠且高质量的生成式AI和多模态的搜索应用。
模型
ReaderLM-v2
ReaderLM-v2 是一个 1.5B 参数语言模型,可将原始 HTML 转换为 markdown 或 JSON,处理最多 512K 个词元组合输入/输出长度,支持 29 种语言。与将 HTML 到 markdown 视为“选择性复制”任务的前身不同,v2 将其视为翻译过程,从而能够出色地处理代码围栏、嵌套列表、表格和 LaTeX 方程式等复杂元素。该模型在不同的上下文长度下保持一致的性能,并引入了具有预定义架构的直接 HTML 到 JSON 生成功能。