sebastian-hofstaetter/distilbert-dot-tas_b-b256-msmarco
Модель на основе DistilBERT для создания
Стоимость
~ 5,00 ₽ за вызовЭта модель предназначена для создания эмбеддингов и признаков текста.
Что она делает
Модель обучена для переранжирования наборов кандидатов или прямого использования для плотного извлечения на основе векторных индексов.
Она использует 6-слойную архитектуру DistilBERT без дополнительных модификаций, фокусируясь на эффективных задачах извлечения.
Как она работает
Модель объединяет вектор CLS для представления запросов и отрывков, используя одни и те же слои BERT для кодирования обоих.
Такой подход обеспечивает лучшие результаты и снижает требования к памяти.
Данные для обучения
Модель была обучена на стандарте MSMARCO с использованием метода TAS-B.
Она использует парные оценки BERT_CAT и модель ColBERT для отрицательных сигналов в пакете.
Возможности
Отзывы
Средний рейтинг 0.0 на основе 0 отзывов.