denis-gordeev commited on
Commit
129e5cf
·
verified ·
1 Parent(s): b31468a

Add new SentenceTransformer model

Browse files
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 312,
3
+ "pooling_mode_cls_token": true,
4
+ "pooling_mode_mean_tokens": false,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,682 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:3136
8
+ - loss:ContrastiveLoss
9
+ base_model: sergeyzh/rubert-tiny-turbo
10
+ widget:
11
+ - source_sentence: Здравствуйте! Я ищу узкую посудомоечную машину шириной 45 см. Какие
12
+ модели вы можете порекомендовать?
13
+ sentences:
14
+ - '{''long_web_name'': ''Microsoft Office Home and Student 2019 Rus Only Medialess
15
+ P6 79G-05207'', ''price'': 3000.0, ''url'': ''https://megamarket.ru/catalog/details/microsoft-office-home-and-student-2019-rus-only-medialess-p6-79g-05207-600005002855/'',
16
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-14/481/134/111/161/848/600005002855b0.jpeg'',
17
+ ''id'': ''600005002855_78577'', ''description'': ''Артикул № 764312 Microsoft
18
+ Office 2019 для дома и учёбы – это пакет самых популярных офисных продуктов от
19
+ Microsoft. Неважно, пользуетесь вы Windows или Mac OS, эти программы обязательно
20
+ пригодятся вам для учебных или домашних задач. В комплект Microsoft Office 2019
21
+ для дома и учёбы входят: Word – текстовый редактор с широкими возможностями форматирования
22
+ текста; Excel – инструмент для работы с таблицами и формулами; Power Point – приложение
23
+ для создания презентаций.'', ''rating'': 4.5, ''review_count'': 16}'
24
+ - '{''long_web_name'': ''Увлажнитель воздуха Timberk T-HU4-A16M-W'', ''price'':
25
+ 13990.0, ''url'': ''https://megamarket.ru/catalog/details/uvlazhnitel-vozduha-timberk-t-hu4-a16m-w-100029966849/'',
26
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-12/949/265/041/114/131/8/100029966849b0.jpg'',
27
+ ''id'': ''100029966849'', ''description'': ''<p>Увлажнитель воздуха Timberk T-HU4-A16M-W
28
+ использует технологию распыления при помощи ультразвуковой мембраны. Это помогает
29
+ получить чрезвычайно мелкие капли. Мощности достаточно для обслуживания помещения
30
+ вплоть до 30 м?. Отсек для воды на 4 л обеспечивает работу до 14 часов.</p>\n
31
+ <h2>Легкое дыхание с пользой для здоровья</h2>\n <p>Производитель предусмотрел
32
+ такие опции, которые положительно сказались на комфорте при эксплуатации:</p>\n
33
+ <ul>\n <li>удобное механическое управление при помощи поворотного регулятора на
34
+ корпусе устройства;</li>\n <li>наличие ароматического режима работы, который обогащает
35
+ воздух смесями с антибактериальными свойствами;</li>\n <li>верхний залив жидкости,
36
+ что позволяет быстро производить дозаправку, не изымая полностью резервуар.</li>\n
37
+ </ul>\n <p>Прибор можно использовать и в ночное время суток, так как уровень шума
38
+ не превышает 35 дБ. Для безопасной работы предусмотрена функция автоматического
39
+ отключения при опустошении резервуара.</p>'', ''rating'': 4.74, ''review_count'':
40
+ 331}'
41
+ - '{''long_web_name'': ''Зарядное утсройство блок кабель для телефона 3A USB Type-C
42
+ 25W'', ''price'': 890.0, ''url'': ''https://megamarket.ru/catalog/details/zaryadnoe-utsroystvo-blok-kabel-dlya-telefona-3a-usb-type-c-25w-600015086154/'',
43
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-17/231/789/941/100/19/600015086154b0.png'',
44
+ ''id'': ''600015086154'', ''description'': ''<p>Зарядное устройство 25W PD – это
45
+ компактное и удобное устройство, предназначенное для быстрой и эффективной зарядки
46
+ вашего устройства. С ним сможете зарядить ваше устройство до 50% всего за 30 минут
47
+ благодаря его высокой мощности 25W. Технология PD ( Power Delivery ) обеспечивает
48
+ умную и оптимальную зарядку, которая автоматически адаптируется к вашему устройству
49
+ для м��ксимальной производительности. Кабель и блок имеет универсальный USB-C порт,
50
+ что позволяет вам заряжать различные совместимые устройства, включая смартфоны,
51
+ планшеты, наушники и другие гаджеты. Компактный дизайн делают зарядник, идеальным
52
+ для путешествий и использования на ходу. Блок зарядки также обладает многоуровневой
53
+ защитой от перегрузки, короткого замыкания, перегрева и других повреждений, обеспечивая
54
+ безопасность и долговечность вашего устройства. Будьте уверены, что ваше устройство
55
+ будет заряжаться быстро, эффективно и безопасно с помощью сетевого адаптера. Это
56
+ надежное и удобное устройство, которое поможет вам всегда оставаться подключенным
57
+ и готовым к действию.</p>'', ''rating'': 0.0, ''review_count'': 0}'
58
+ - source_sentence: Здравствуйте! Мне нужны редукторы для моего блендера. Это те детали,
59
+ которые помогают передавать вращение от мотора к ножам. Не подскажете, есть ли
60
+ у вас такие в наличии?
61
+ sentences:
62
+ - '{''long_web_name'': ''Цифро-аналоговый преобразователь Hiby Hiby W5'', ''price'':
63
+ 9005.0, ''url'': ''https://megamarket.ru/catalog/details/cifro-analogovyy-preobrazovatel-hiby-hiby-w5-600004460473/'',
64
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/101/310/993/491/164/600004460473b0.jpeg'',
65
+ ''id'': ''600004460473'', ''description'': ''Hiby W5 – современный Bluetooth-адаптер
66
+ с ЦАП и усилителем для наушников. Девайс оснащён продвинутым чипом ЦАП ES9218P
67
+ от ESS Technology в сочетании с микросхемой CSR8675 от Quallcomm, отвечающей за
68
+ работу по Bluetooth.Адаптер поддерживает Bluetooth спецификации 5.0 и абсолютное
69
+ большинство современных кодеков, включая UAT, LDAC, aptX, aptX HD, aptX LL, SBC
70
+ и AAC. \xa0Разработка Hiby – кодек UAT позволяет обрабатывать аудио с частотой
71
+ дискретизации до 192 кГц и битрейтом 1,2 Мбит/c, что превышает показатели даже
72
+ всемирно известного LDAC от Sony. UAT совместим с мобильными телефонами и Hi-Fi-плеерами
73
+ на базе Android. Например, поддержку имеют все плееры HiBy, Hidizs AP80, Cayin
74
+ N8 и другие устройства с ОС HiBy. Пользователям Android необходимо будет установить
75
+ приложение HiByMusic.Корпус W5 имеет компактный размер, он выполнен из нержавеющей
76
+ стали и защищён от влаги и пыли по стандарту IP67. Адаптер поставляется с карманным
77
+ зажимом, благодаря чему его можно легко разместить на одежде.Hiby W5 оснащен встроенным
78
+ микрофоном и пультом. Одним щелчком мыши вы можете переключаться между воспроизведением
79
+ музыки и ответом на звонок.Благодаря встроенному аккумулятору и зарядному чехлу,
80
+ который может полностью зарядить W5 не менее пяти раз, устройство способно обеспечить
81
+ до 20 часов воспроизведения.'', ''rating'': 5.0, ''review_count'': 3}'
82
+ - '{''long_web_name'': ''Охлаждающая подставка для ноутбука KS-IS KS-740 до 19"'',
83
+ ''price'': 3290.0, ''url'': ''https://megamarket.ru/catalog/details/ohlazhdayushaya-podstavka-dlya-noutbuka-ks-is-ks-740-do-19-600010906101/'',
84
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-12/806/641/346/181/21/600010906101b0.jpeg'',
85
+ ''id'': ''600010906101'', ''description'': ''Охлаждающая подставка для ноутбука
86
+ с монолитной конструкцией и тремя вентиляторами (80 мм), вращающимся со скоростью
87
+ 2000об/мин, значительно рассеивает тепло от ноутбука, обеспечивает его хорошее
88
+ рабочее состояние и продлевает срок службы. вашего ноутбука. Прочная охлаждающая
89
+ подставка для ноутбука Поверхность охлаждающей подставки изготовлена из алюминиевого
90
+ сплава, который может отводить тепло от ноутбука, улучшать рассеивание тепла и
91
+ обеспечивает вашему ноутбуку износостойкую и прочную поверхность для переноски,
92
+ что позволяет перевозить, положив его в сумку для ноутбука. Охлаждающая подставка
93
+ для ноутбука с 3 регулировками по высоте Три регулируемых настройки высоты, чтобы
94
+ поставить подставку в вертикальное или плоское положение и удерживать ноутбук
95
+ в подходящем положении. Специальная перегородка на подставке предотвращает скольжение
96
+ или падение вашего ноутбука. Два USB-порта Просто подключите подставку в USB-порт
97
+ вашего ноутбука, чтобы использовать. Оборудована двумя портами USB 2.0 для передачи
98
+ данных или подключения других устройств, в комплект входит один USB-кабель. Сверхтихие
99
+ кулеры для ноутбука Конструкция подставки для охлаждения ноутбука с шумоподавлением
100
+ делает ее не беспокоящей вас даже при максимальной мощности, позволяя вам сосредоточиться
101
+ на просмотре видео или работе, обеспечивая комфортную рабочую среду. Скорость
102
+ вентиляторов регулируется, Вы можете подобрать оптимальный режим для работы. Подготовка
103
+ подставки к работе 1) подключите кабель USB из комплекта поставки одним концом
104
+ в USB порт подставки (на тыльной ее части), другим концом в порт USB (рекомендуется
105
+ порт стандарта не ниже USB 3.2 Gen 1) ноутбука 2) включите подставку (кнопка
106
+ включения на тыльной стороне) 3) выберите оптимальный цвет подсветки RGB (переключается
107
+ кнопкой на тыльной стороне подставки) и скорость вращения вентиляторов (регулятор-колесико
108
+ расположен на правой стороне подставки) Характеристики Подсветка RGB (8 режимов) Материал
109
+ корпуса- ABS пластик, металл Количество вентиляторов - 3 Размер вентиляторов
110
+ - 80 х 80 мм, воздушный поток: 76м3/ч Скорость вращения вентиляторов 2000 - 2500
111
+ об/мин (+-10%) Низкий уровень шума 20 дБА Совместима с ноутбуками с размером
112
+ экрана До 19 дюймов Регулируется по высоте , 3 уровня регулировки положений USB
113
+ - 2 порта USB 1.1. Один порт для питания подставки, второй для подключения переферийного
114
+ USB устройства. Размер без упаковки - 42x27x3 см'', ''rating'': 4.6, ''review_count'':
115
+ 49}'
116
+ - '{''long_web_name'': ''Аксессуар для видеокарты NVIDIA RTX LOW PROFILE BRACKET
117
+ A2000'', ''price'': 783.0, ''url'': ''https://megamarket.ru/catalog/details/planka-dlya-videokarty-rtx-low-profile-bracket-a2000-12gb-nvidia-100046937787/'',
118
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/109/972/170/425/191/5/100046937787b0.jpg'',
119
+ ''id'': ''100046937787'', ''description'': '''', ''rating'': 0.0, ''review_count'':
120
+ 0}'
121
+ - source_sentence: Здравствуйте! Мне нужно купить карты памяти MicroSD, чтобы использовать
122
+ их в моём телефоне и планшете. Хотелось бы что-то надёжное и с хорошей скоростью
123
+ записи. Можете помочь выбра��ь?
124
+ sentences:
125
+ - '{''long_web_name'': ''Сетевое зарядное устройство Apple MHJE3ZM/A 20W Power Adapter,
126
+ 1xUSB Type-C, 2.2A, white'', ''price'': 990.0, ''description'': ''<div><p>Сетевое
127
+ зарядное устройство Apple MHJE3ZM/A 20W Power Adapter, 1xUSB Type-C, 2.2A, white
128
+ — универсальная модель, совместимая со всеми современными гаджетами.</p>\n<h2>Продуманная
129
+ конструкция</h2>\n<p>Корпус выполнен из качественного пластика — прочный материал,
130
+ устойчивый к механическим повреждениям. Дополнительные технические параметры:</p>\n<ul>\n<li>Подходит
131
+ для зарядки смартфонов, планшетов, ноутбуков, наушников и других устройств.</li>\n<li>Стандарт
132
+ быстрой зарядки Power Delivery обеспечивает высокую скорость передачи энергии.</li>\n<li>Защита
133
+ от короткого замыкания и перегрева продлевают срок службы.</li>\n</ul>\n<p>Мощность
134
+ 20 Вт позволяет быстро зарядить аккумулятор практически любого современного гаджета.
135
+ Для удобства использования предусмотрен съемный кабель.</p></div>'', ''rating'':
136
+ 4.8, ''review_count'': 8132}'
137
+ - '{''long_web_name'': ''Охлаждающая подставка для ноутбука KS-IS KS-740 до 19"'',
138
+ ''price'': 3290.0, ''url'': ''https://megamarket.ru/catalog/details/ohlazhdayushaya-podstavka-dlya-noutbuka-ks-is-ks-740-do-19-600010906101/'',
139
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-12/806/641/346/181/21/600010906101b0.jpeg'',
140
+ ''id'': ''600010906101'', ''description'': ''Охлаждающая подставка для ноутбука
141
+ с монолитной конструкцией и тремя вентиляторами (80 мм), вращающимся со скоростью
142
+ 2000об/мин, значительно рассеивает тепло от ноутбука, обеспечивает его хорошее
143
+ рабочее состояние и продлевает срок службы. вашего ноутбука. Прочная охлаждающая
144
+ подставка для ноутбука Поверхность охлаждающей подставки изготовлена из алюминиевого
145
+ сплава, который может отводить тепло от ноутбука, улучшать рассеивание тепла и
146
+ обеспечивает вашему ноутбуку износостойкую и прочную поверхность для переноски,
147
+ что позволяет перевозить, положив его в сумку для ноутбука. Охлаждающая подставка
148
+ для ноутбука с 3 регулировками по высоте Три регулируемых настройки высоты, чтобы
149
+ поставить подставку в вертикальное или плоское положение и удерживать ноутбук
150
+ в подходящем положении. Специальная перегородка на подставке предотвращает скольжение
151
+ или падение вашего ноутбука. Два USB-порта Просто подключите подставку в USB-порт
152
+ вашего ноутбука, чтобы использовать. Оборудована двумя портами USB 2.0 для передачи
153
+ данных или подключения других устройств, в комплект входит один USB-кабель. Сверхтихие
154
+ кулеры для ноутбука Конструкция подставки для охлаждения ноутбука с шумоподавлением
155
+ делает ее не беспокоящей вас даже при максимальной мощности, позволяя вам сосредоточиться
156
+ на просмотре видео или работе, обеспечивая комфортную рабочую среду. Скорость
157
+ вентиляторов регулируется, Вы можете подобрать оптимальный режим для работы. Подготовка
158
+ подставки к работе 1) подключите кабель USB из комплекта поставки одним концом
159
+ в USB порт подставки (на тыльной ее части), другим концом в порт USB (рекомендует��я
160
+ порт стандарта не ниже USB 3.2 Gen 1) ноутбука 2) включите подставку (кнопка
161
+ включения на тыльной стороне) 3) выберите оптимальный цвет подсветки RGB (переключается
162
+ кнопкой на тыльной стороне подставки) и скорость вращения вентиляторов (регулятор-колесико
163
+ расположен на правой стороне подставки) Характеристики Подсветка RGB (8 режимов) Материал
164
+ корпуса- ABS пластик, металл Количество вентиляторов - 3 Размер вентиляторов
165
+ - 80 х 80 мм, воздушный поток: 76м3/ч Скорость вращения вентиляторов 2000 - 2500
166
+ об/мин (+-10%) Низкий уровень шума 20 дБА Совместима с ноутбуками с размером
167
+ экрана До 19 дюймов Регулируется по высоте , 3 уровня регулировки положений USB
168
+ - 2 порта USB 1.1. Один порт для питания подставки, второй для подключения переферийного
169
+ USB устройства. Размер без упаковки - 42x27x3 см'', ''rating'': 4.6, ''review_count'':
170
+ 49}'
171
+ - '{''long_web_name'': ''Швейная машина Janome Excellent Stitch 300'', ''price'':
172
+ 50509.0, ''url'': ''https://megamarket.ru/catalog/details/shveynaya-mashina-janome-excellent-stitch-300-600005235554/'',
173
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/179/146/900/512/815/46/600005235554b0.jpeg'',
174
+ ''id'': ''600005235554_87239'', ''description'': ''<div><p>Швейная машина Janome
175
+ Excellent Stitch 300 – это устройство, которое поможет создать красивую вещь даже
176
+ начинающему пользователю.</p>\n<h2>Современная техника</h2>\n<p>Машина оснащена
177
+ компьютерным управлением, что позволяет ей самостоятельно выбирать оптимальную
178
+ длину и ширину стежка, а также регулировать давление лапки на ткань. Пользователь
179
+ может выбрать одну из 300 встроенных программ, среди которых есть как самые простые
180
+ строчки, так и сложные декоративные элементы. Также есть возможность создания
181
+ собственных рисунков. К особенностям модели относятся:</p>\n<ul>\n<li>ротационный
182
+ горизонтальный челнок обеспечивает ровную и гладкую строчку;</li>\n<li>максимальная
183
+ скорость шитья составляет 820 стежков в минуту;</li>\n<li>есть функция реверса,
184
+ позволяющая распустить неправильно сделанный шов.</li>\n</ul>\n<p>Помимо этого,
185
+ предусмотрены дополнительные аксессуары, которые входят в комплект поставки. Это
186
+ позволит сразу приступить к работе после приобретения устройства.</p></div>'',
187
+ ''rating'': 5.0, ''review_count'': 3}'
188
+ - source_sentence: Здравствуйте! Я хочу купить пылесос, который небольшой и удобный,
189
+ чтобы им можно было быстро убирать мусор с пола. Подскажите, пожалуйста, у вас
190
+ есть такие вертикальные пылесосы?
191
+ sentences:
192
+ - '{''long_web_name'': ''Пылесос Gorenje SVC252FMWT белый'', ''price'': 17099.0,
193
+ ''description'': '''', ''rating'': 4.61, ''review_count'': 23}'
194
+ - '{''long_web_name'': ''Встраиваемая посудомоечная машина KUPPERSBERG GSM 6074'',
195
+ ''price'': 47699.0, ''url'': ''https://megamarket.ru/catalog/details/posudomoechnaya-mashina-kuppersberg-gsm-6074-600005006810/'',
196
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/106/877/513/742/316/30/600005006810b0.jpg'',
197
+ ''id'': ''600005006810'', ''description'': ''Встраиваемая посудомоечная машина
198
+ GSM 6074 шириной 60 см один из незаменимых кухонных бытовых приборов на любой
199
+ кухне. Удобство данного агрегата заключается в выполнении ряда функций:способность
200
+ вместить 14 комплектов посуды;программирование по 7 режимам;3 регулируемых корзины
201
+ для столовых приборов;специальная полка для чашек.Aquastop - функция Аква Стоп
202
+ обезопасит вас от протечекРежим «Все в 1» автоматически подберет программу, исходя
203
+ из особенностей моющего средства.Решитесь приобрести посудомоечную машину GSM
204
+ 6074 для того, чтобы наслаждаться безупречной чистотой вымытой посуды.'', ''rating'':
205
+ 4.7, ''review_count'': 123}'
206
+ - '{''long_web_name'': ''Бокс внешний для жесткого диска UGREEN US221 30847 2.5
207
+ Inch Hard Drive Box с кабелем USB'', ''price'': 1520.0, ''url'': ''https://megamarket.ru/catalog/details/boks-vneshniy-dlya-zhestkogo-diska-ugreen-us221-30847-25-inch-hard-drive-box-s-kabelem-usb-600010907194/'',
208
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-12/517/639/817/785/8/600010907194b0.png'',
209
+ ''id'': ''600010907194'', ''description'': ''<p>Вход: USB A 3.0 Male. Выход: (7+15)Pin
210
+ SATA 3.0 порт. Чипсет: VL711F0. SATA 3.0, скорость до 6 Гбит/с, совместимость
211
+ с SATA 2.0/1.0 *USB 3.0, скорость до 5 Гбит/с, совместимость с USB 2.0 и 1.1 *Для
212
+ 9,5 мм 7,5 мм 2,5 дюйма SATA I II III, HDD, SSD до 6 ТБ. Поддержка UASP. Не нужны
213
+ дополнительные инструменты для установки. Поддерживает операционные системы Windows
214
+ 2000 / XP / Vista / 7/8 / 8.1 / 10, LINUX, Mac OS 8.0 и выше. Размер: Д128,5 x
215
+ Ш82 x В14 (мм). Длина кабеля: 30 см.</p>'', ''rating'': 5.0, ''review_count'':
216
+ 18}'
217
+ - source_sentence: Здравствуйте! Я хочу купить внешний диск для хранения данных, желательно
218
+ SSD. Нужно, чтобы он был надёжным и быстрым, для переноса больших файлов. Можете
219
+ помочь подобрать подходящий?
220
+ sentences:
221
+ - '{''long_web_name'': ''Сумка унисекс K&F Concept Storage Bag черная, 26х16х10
222
+ см'', ''price'': 3259.0, ''description'': ''<p>Поместится все <p>В сумке предусмотрено
223
+ 23 отделения для хранения самых разных вещей: смартфон, зарядное устройство, кабели
224
+ для передачи данных, usb-накопители, ключи от машины, банковские карты и прочие
225
+ ценности </p> Полный или частичный доступ <p>Удобная функция открытия и закрытия
226
+ на 120° позволяет использовать несколько комбинаций внутренних отсеков, обеспечивая
227
+ высокую степень свободы в адаптации к различным сценариям использования, делая
228
+ организацию вещей еще более удобной </p> Для путешествий и работы <p>Компактная
229
+ и легкая сумка весом всего 250 г - идеальный выбор для деловых встреч или путешествий.
230
+ Она не занимает много места в чемодане или рюкзаке, но при этом обладает внушительной
231
+ вместимостью </p> Прочные и надежные материалы изготовления <p>Модель изготовлена
232
+ из водонепроницаемого нейлона, с высокопрочной строчкой и противоугонной молнией,
233
+ гарантирующей износостойкость и долговечность. Она надежно защищает хранящиеся
234
+ внутри вещи от каких либо повреждений </p> Водонепроницаемый нейлон <p>Благодаря
235
+ водонепроницаемому нейлону сумка не пропускает влагу внутрь, а также обеспечивает
236
+ легкий уход за внешней поверхностью. Внутри модель оснащена эластичной тканью,
237
+ отличающейся особой мягкостью и безопасностью для хрупких предметов или гаджетов
238
+ </p></p>'', ''rating'': 0.0, ''review_count'': 0}'
239
+ - '{''long_web_name'': ''Внешний SSD диск KingSpec 240 ГБ Z3-240'', ''price'': 4129.0,
240
+ ''description'': '''', ''rating'': 0.0, ''review_count'': 0}'
241
+ - '{''long_web_name'': ''Моноблок MSI AM272P 12M-400RU White (9S6-AF8212-498)'',
242
+ ''price'': 122661.0, ''url'': ''https://megamarket.ru/catalog/details/monoblok-msi-am272p-12m-400ru-white-9s6-af8212-498-100068211829/'',
243
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/125/947/036/513/181/4/100068211829b0.webp'',
244
+ ''id'': ''100068211829'', ''description'': '''', ''rating'': 0.0, ''review_count'':
245
+ 0}'
246
+ pipeline_tag: sentence-similarity
247
+ library_name: sentence-transformers
248
+ metrics:
249
+ - cosine_accuracy
250
+ - cosine_accuracy_threshold
251
+ - cosine_f1
252
+ - cosine_f1_threshold
253
+ - cosine_precision
254
+ - cosine_recall
255
+ - cosine_ap
256
+ model-index:
257
+ - name: SentenceTransformer based on sergeyzh/rubert-tiny-turbo
258
+ results:
259
+ - task:
260
+ type: binary-classification
261
+ name: Binary Classification
262
+ dataset:
263
+ name: item classification
264
+ type: item-classification
265
+ metrics:
266
+ - type: cosine_accuracy
267
+ value: 0.9617346938775511
268
+ name: Cosine Accuracy
269
+ - type: cosine_accuracy_threshold
270
+ value: 0.8327065110206604
271
+ name: Cosine Accuracy Threshold
272
+ - type: cosine_f1
273
+ value: 0.88
274
+ name: Cosine F1
275
+ - type: cosine_f1_threshold
276
+ value: 0.8327065110206604
277
+ name: Cosine F1 Threshold
278
+ - type: cosine_precision
279
+ value: 0.873015873015873
280
+ name: Cosine Precision
281
+ - type: cosine_recall
282
+ value: 0.8870967741935484
283
+ name: Cosine Recall
284
+ - type: cosine_ap
285
+ value: 0.9106157533671668
286
+ name: Cosine Ap
287
+ ---
288
+
289
+ # SentenceTransformer based on sergeyzh/rubert-tiny-turbo
290
+
291
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [sergeyzh/rubert-tiny-turbo](https://huggingface.co/sergeyzh/rubert-tiny-turbo). It maps sentences & paragraphs to a 312-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
292
+
293
+ ## Model Details
294
+
295
+ ### Model Description
296
+ - **Model Type:** Sentence Transformer
297
+ - **Base model:** [sergeyzh/rubert-tiny-turbo](https://huggingface.co/sergeyzh/rubert-tiny-turbo) <!-- at revision 93769a3baad2b037e5c2e4312fccf6bcfe082bf1 -->
298
+ - **Maximum Sequence Length:** 2048 tokens
299
+ - **Output Dimensionality:** 312 dimensions
300
+ - **Similarity Function:** Cosine Similarity
301
+ <!-- - **Training Dataset:** Unknown -->
302
+ <!-- - **Language:** Unknown -->
303
+ <!-- - **License:** Unknown -->
304
+
305
+ ### Model Sources
306
+
307
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
308
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
309
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
310
+
311
+ ### Full Model Architecture
312
+
313
+ ```
314
+ SentenceTransformer(
315
+ (0): Transformer({'max_seq_length': 2048, 'do_lower_case': False}) with Transformer model: BertModel
316
+ (1): Pooling({'word_embedding_dimension': 312, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
317
+ (2): Normalize()
318
+ )
319
+ ```
320
+
321
+ ## Usage
322
+
323
+ ### Direct Usage (Sentence Transformers)
324
+
325
+ First install the Sentence Transformers library:
326
+
327
+ ```bash
328
+ pip install -U sentence-transformers
329
+ ```
330
+
331
+ Then you can load this model and run inference.
332
+ ```python
333
+ from sentence_transformers import SentenceTransformer
334
+
335
+ # Download from the 🤗 Hub
336
+ model = SentenceTransformer("denis-gordeev/reranker_dialog_items_biencoder_rubert-tiny-turbo-4")
337
+ # Run inference
338
+ sentences = [
339
+ 'Здравствуйте! Я хочу купить внешний диск для хранения данных, желательно SSD. Нужно, чтобы он был надёжным и быстрым, для переноса больших файлов. Можете помочь подобрать подходящий?',
340
+ "{'long_web_name': 'Внешний SSD диск KingSpec 240 ГБ Z3-240', 'price': 4129.0, 'description': '', 'rating': 0.0, 'review_count': 0}",
341
+ "{'long_web_name': 'Моноблок MSI AM272P 12M-400RU White (9S6-AF8212-498)', 'price': 122661.0, 'url': 'https://megamarket.ru/catalog/details/monoblok-msi-am272p-12m-400ru-white-9s6-af8212-498-100068211829/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/125/947/036/513/181/4/100068211829b0.webp', 'id': '100068211829', 'description': '', 'rating': 0.0, 'review_count': 0}",
342
+ ]
343
+ embeddings = model.encode(sentences)
344
+ print(embeddings.shape)
345
+ # [3, 312]
346
+
347
+ # Get the similarity scores for the embeddings
348
+ similarities = model.similarity(embeddings, embeddings)
349
+ print(similarities.shape)
350
+ # [3, 3]
351
+ ```
352
+
353
+ <!--
354
+ ### Direct Usage (Transformers)
355
+
356
+ <details><summary>Click to see the direct usage in Transformers</summary>
357
+
358
+ </details>
359
+ -->
360
+
361
+ <!--
362
+ ### Downstream Usage (Sentence Transformers)
363
+
364
+ You can finetune this model on your own dataset.
365
+
366
+ <details><summary>Click to expand</summary>
367
+
368
+ </details>
369
+ -->
370
+
371
+ <!--
372
+ ### Out-of-Scope Use
373
+
374
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
375
+ -->
376
+
377
+ ## Evaluation
378
+
379
+ ### Metrics
380
+
381
+ #### Binary Classification
382
+
383
+ * Dataset: `item-classification`
384
+ * Evaluated with [<code>BinaryClassificationEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.BinaryClassificationEvaluator)
385
+
386
+ | Metric | Value |
387
+ |:--------------------------|:-----------|
388
+ | cosine_accuracy | 0.9617 |
389
+ | cosine_accuracy_threshold | 0.8327 |
390
+ | cosine_f1 | 0.88 |
391
+ | cosine_f1_threshold | 0.8327 |
392
+ | cosine_precision | 0.873 |
393
+ | cosine_recall | 0.8871 |
394
+ | **cosine_ap** | **0.9106** |
395
+
396
+ <!--
397
+ ## Bias, Risks and Limitations
398
+
399
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
400
+ -->
401
+
402
+ <!--
403
+ ### Recommendations
404
+
405
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
406
+ -->
407
+
408
+ ## Training Details
409
+
410
+ ### Training Dataset
411
+
412
+ #### Unnamed Dataset
413
+
414
+
415
+ * Size: 3,136 training samples
416
+ * Columns: <code>anchor</code>, <code>text</code>, and <code>label</code>
417
+ * Approximate statistics based on the first 1000 samples:
418
+ | | anchor | text | label |
419
+ |:--------|:-----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|:------------------------------------------------|
420
+ | type | string | string | int |
421
+ | details | <ul><li>min: 23 tokens</li><li>mean: 43.03 tokens</li><li>max: 91 tokens</li></ul> | <ul><li>min: 52 tokens</li><li>mean: 313.24 tokens</li><li>max: 1009 tokens</li></ul> | <ul><li>0: ~81.90%</li><li>1: ~18.10%</li></ul> |
422
+ * Samples:
423
+ | anchor | text | label |
424
+ |:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
425
+ | <code>Привет! Подскажите, пожалуйста, у вас есть средства для чистки и ухода за холодильником? Ищу что-то недорогое, но эффективное.</code> | <code>{'long_web_name': 'Смартфон Huawei nova 10 8/128Gb Starry Silver', 'price': 29590.0, 'url': 'https://megamarket.ru/catalog/details/pda-huawei-nco-lx1-8-128gb-s-100057069468/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-98/769/723/010/212/31/100057069468b0.jpg', 'id': '100057069468', 'description': '<p>Смартфон Huawei nova 10 8/128Gb Starry Silver — это современный гаджет, который позволяет общаться, работать и развлекаться.</p>\n<h2>Помогает оставаться на связи</h2>\n<p>Устройство оснащено большим экраном с высоким разрешением. На нем удобно смотреть фильмы, играть в игры и читать книги. Есть встроенные динамики, которые обеспечивают качественный звук. Другие параметры смартфона:</p>\n<ul>\n<li>основная камера состоит из трех модулей — они делают яркие и детализированные снимки;</li>\n<li>встроенный сканер отпечатков пальцев — для быстрого доступа к устройству;</li>\n<li>поддерживает функцию бесконтактной оплаты через Google Pay.</li>\n</ul>\n<p>Смартфон работае...</code> | <code>0</code> |
426
+ | <code>Здравствуйте! Я Андрей, мне 38 лет, я покупаю у вас товары для своего бизнеса по ремонту бытовой техники в Воронеже. Мне нужны моноблоки — это такие настольные компьютеры, где всё встроено в монитор. Интересуют недорогие модели для тестирования программного обеспечения и проведения диагностики. Можете порекомендовать что-то подходящее?</code> | <code>{'long_web_name': 'Моноблок MSI PRO AP242 12M-450RU белый', 'price': 78299.0, 'description': '<p>Моноблок MSI Pro AP242 12M-450RU — это производительная рабочая станция для офисных задач.</p>\n<h2>Комфортная работа</h2>\n<p>Корпус выполнен в белом цвете. Матовое покрытие дисплея защищает от бликов. Другие технические параметры:</p>\n<ul>\n<li>мощный процессор Intel Core i5 12400;</li>\n<li>графический чип UHD Graphics 730;</li>\n<li>оперативная память объемом 16 Гб с возможностью расширения до 64 Гб;</li>\n<li>встроенная веб-камера для общения через Skype и Zoom;</li>\n<li>внутренний накопитель SSD на 512 Гб обеспечивает быстрый доступ к файлам;</li>\n<li>поддерживается беспроводная сеть стандарта 802.11ax.</li>\n</ul>\n<p>Предусмотрены два порта USB 3.2 Type-C и два USB 2.0 Type-A. Есть выход HDMI для подключения монитора или телевизора. Для воспроизведения звука есть встроенные динамики и микрофон.</p>', 'rating': 5.0, 'review_count': 18}</code> | <code>0</code> |
427
+ | <code>Здравствуйте! Мне нужно купить карты памяти MicroSD, чтобы использовать их в моём телефоне и планшете. Хотелось бы что-то надёжное и с хорошей скоростью записи. Можете помочь выбрать?</code> | <code>{'long_web_name': 'Флэш карта Kingston Canvas Select Plus SDCS2/32GB microSDHC Class10, 32 Gb, adapter', 'price': 740.0, 'description': '', 'rating': 4.93, 'review_count': 587}</code> | <code>1</code> |
428
+ * Loss: [<code>ContrastiveLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#contrastiveloss) with these parameters:
429
+ ```json
430
+ {
431
+ "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
432
+ "margin": 0.5,
433
+ "size_average": true
434
+ }
435
+ ```
436
+
437
+ ### Evaluation Dataset
438
+
439
+ #### Unnamed Dataset
440
+
441
+
442
+ * Size: 392 evaluation samples
443
+ * Columns: <code>anchor</code>, <code>text</code>, and <code>label</code>
444
+ * Approximate statistics based on the first 392 samples:
445
+ | | anchor | text | label |
446
+ |:--------|:-----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|:------------------------------------------------|
447
+ | type | string | string | int |
448
+ | details | <ul><li>min: 23 tokens</li><li>mean: 42.23 tokens</li><li>max: 91 tokens</li></ul> | <ul><li>min: 53 tokens</li><li>mean: 322.99 tokens</li><li>max: 1058 tokens</li></ul> | <ul><li>0: ~84.18%</li><li>1: ~15.82%</li></ul> |
449
+ * Samples:
450
+ | anchor | text | label |
451
+ |:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
452
+ | <code>Здравствуйте! Мне нужны магнитные кабели для зарядки моих устройств в походах. Хочу заказать несколько штук, можно с разными разъёмами (USB-C, Micro USB, и Lightning). Желательно, чтобы они были качественными и прочными. Можете помочь с этим?</code> | <code>{'long_web_name': 'Смартфон Samsung Galaxy Z Flip 6 SM-F741B, 256 Гб, Yellow', 'price': 81990.0, 'url': 'https://megamarket.ru/catalog/details/smartfon-samsung-galaxy-z-flip-6-sm-f741b-256-gb-yellow-1-sht-100069687356/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-12/153/984/177/231/36/100069687356b0.png', 'id': '100069687356', 'description': 'Смартфон Samsung Galaxy Z Flip6 Yellow с раскладным экраном. Гибкий безрамочный дисплей 6.7" с матрицей Dynamic AMOLED 2X FHD+, частотой обновления 120 Гц и плотностью пикселей 426 ppi — передает четкое детализированное изображение с яркими и насыщенными цветами. Покрытие Corning® Gorilla® Glass Victus® защищает дисплей от механических повреждений. Процессор Qualcomm Snapdragon 8 Gen 3 с графическим ускорителем Qualcomm Adreno 750 — обеспечивает высокую производительность и плавную работу системы. Внутренняя память объемом 256 ГБ — предоставляет достаточно места для хранения большого количества данных, фотографий и видео. А...</code> | <code>0</code> |
453
+ | <code>Здравствуйте! Мне нужны сумки и рюкзаки для фототехники. Что-то удобное и вместительное, чтобы можно было безопасно носить зеркальный фотоаппарат и несколько объективов. Можно посмотреть варианты?</code> | <code>{'long_web_name': 'Фильтр ZUMMAN FHR2', 'price': 14.0, 'url': 'https://megamarket.ru/catalog/details/filtr-zumman-fhr2-100026967888/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-13/878/305/792/603/9/100026967888b0.jpg', 'id': '100026967888_7', 'description': '', 'rating': 0.0, 'review_count': 0}</code> | <code>0</code> |
454
+ | <code>Здравствуйте! Ищу умные часы Apple Watch Series 2. Скажите, пожалуйста, есть ли у вас в наличии?</code> | <code>{'long_web_name': 'Смарт-часы Apple Watch Series 9 45 мм Midnight размер ML', 'price': 58373.0, 'description': 'Смарт-часы Apple Watch. Материал корпуса — алюминий. Время работы в активном режиме — до 18 часов. Функция Double Tap активируется посредством двух быстрых касаний указательного и большого пальцев — можно ответить на звонок, выключить будильник и управлять воспроизведением музыки. Объем встроенной памяти — 64 Гб. В комплекте — кабель USB?C с магнитным креплением для быстрой зарядки', 'rating': 4.97, 'review_count': 114}</code> | <code>0</code> |
455
+ * Loss: [<code>ContrastiveLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#contrastiveloss) with these parameters:
456
+ ```json
457
+ {
458
+ "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
459
+ "margin": 0.5,
460
+ "size_average": true
461
+ }
462
+ ```
463
+
464
+ ### Training Hyperparameters
465
+ #### Non-Default Hyperparameters
466
+
467
+ - `eval_strategy`: steps
468
+ - `num_train_epochs`: 5
469
+ - `warmup_ratio`: 0.1
470
+ - `fp16`: True
471
+ - `load_best_model_at_end`: True
472
+ - `batch_sampler`: no_duplicates
473
+
474
+ #### All Hyperparameters
475
+ <details><summary>Click to expand</summary>
476
+
477
+ - `overwrite_output_dir`: False
478
+ - `do_predict`: False
479
+ - `eval_strategy`: steps
480
+ - `prediction_loss_only`: True
481
+ - `per_device_train_batch_size`: 8
482
+ - `per_device_eval_batch_size`: 8
483
+ - `per_gpu_train_batch_size`: None
484
+ - `per_gpu_eval_batch_size`: None
485
+ - `gradient_accumulation_steps`: 1
486
+ - `eval_accumulation_steps`: None
487
+ - `torch_empty_cache_steps`: None
488
+ - `learning_rate`: 5e-05
489
+ - `weight_decay`: 0.0
490
+ - `adam_beta1`: 0.9
491
+ - `adam_beta2`: 0.999
492
+ - `adam_epsilon`: 1e-08
493
+ - `max_grad_norm`: 1.0
494
+ - `num_train_epochs`: 5
495
+ - `max_steps`: -1
496
+ - `lr_scheduler_type`: linear
497
+ - `lr_scheduler_kwargs`: {}
498
+ - `warmup_ratio`: 0.1
499
+ - `warmup_steps`: 0
500
+ - `log_level`: passive
501
+ - `log_level_replica`: warning
502
+ - `log_on_each_node`: True
503
+ - `logging_nan_inf_filter`: True
504
+ - `save_safetensors`: True
505
+ - `save_on_each_node`: False
506
+ - `save_only_model`: False
507
+ - `restore_callback_states_from_checkpoint`: False
508
+ - `no_cuda`: False
509
+ - `use_cpu`: False
510
+ - `use_mps_device`: False
511
+ - `seed`: 42
512
+ - `data_seed`: None
513
+ - `jit_mode_eval`: False
514
+ - `use_ipex`: False
515
+ - `bf16`: False
516
+ - `fp16`: True
517
+ - `fp16_opt_level`: O1
518
+ - `half_precision_backend`: auto
519
+ - `bf16_full_eval`: False
520
+ - `fp16_full_eval`: False
521
+ - `tf32`: None
522
+ - `local_rank`: 0
523
+ - `ddp_backend`: None
524
+ - `tpu_num_cores`: None
525
+ - `tpu_metrics_debug`: False
526
+ - `debug`: []
527
+ - `dataloader_drop_last`: False
528
+ - `dataloader_num_workers`: 0
529
+ - `dataloader_prefetch_factor`: None
530
+ - `past_index`: -1
531
+ - `disable_tqdm`: False
532
+ - `remove_unused_columns`: True
533
+ - `label_names`: None
534
+ - `load_best_model_at_end`: True
535
+ - `ignore_data_skip`: False
536
+ - `fsdp`: []
537
+ - `fsdp_min_num_params`: 0
538
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
539
+ - `fsdp_transformer_layer_cls_to_wrap`: None
540
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
541
+ - `deepspeed`: None
542
+ - `label_smoothing_factor`: 0.0
543
+ - `optim`: adamw_torch
544
+ - `optim_args`: None
545
+ - `adafactor`: False
546
+ - `group_by_length`: False
547
+ - `length_column_name`: length
548
+ - `ddp_find_unused_parameters`: None
549
+ - `ddp_bucket_cap_mb`: None
550
+ - `ddp_broadcast_buffers`: False
551
+ - `dataloader_pin_memory`: True
552
+ - `dataloader_persistent_workers`: False
553
+ - `skip_memory_metrics`: True
554
+ - `use_legacy_prediction_loop`: False
555
+ - `push_to_hub`: False
556
+ - `resume_from_checkpoint`: None
557
+ - `hub_model_id`: None
558
+ - `hub_strategy`: every_save
559
+ - `hub_private_repo`: None
560
+ - `hub_always_push`: False
561
+ - `gradient_checkpointing`: False
562
+ - `gradient_checkpointing_kwargs`: None
563
+ - `include_inputs_for_metrics`: False
564
+ - `include_for_metrics`: []
565
+ - `eval_do_concat_batches`: True
566
+ - `fp16_backend`: auto
567
+ - `push_to_hub_model_id`: None
568
+ - `push_to_hub_organization`: None
569
+ - `mp_parameters`:
570
+ - `auto_find_batch_size`: False
571
+ - `full_determinism`: False
572
+ - `torchdynamo`: None
573
+ - `ray_scope`: last
574
+ - `ddp_timeout`: 1800
575
+ - `torch_compile`: False
576
+ - `torch_compile_backend`: None
577
+ - `torch_compile_mode`: None
578
+ - `dispatch_batches`: None
579
+ - `split_batches`: None
580
+ - `include_tokens_per_second`: False
581
+ - `include_num_input_tokens_seen`: False
582
+ - `neftune_noise_alpha`: None
583
+ - `optim_target_modules`: None
584
+ - `batch_eval_metrics`: False
585
+ - `eval_on_start`: False
586
+ - `use_liger_kernel`: False
587
+ - `eval_use_gather_object`: False
588
+ - `average_tokens_across_devices`: False
589
+ - `prompts`: None
590
+ - `batch_sampler`: no_duplicates
591
+ - `multi_dataset_batch_sampler`: proportional
592
+
593
+ </details>
594
+
595
+ ### Training Logs
596
+ | Epoch | Step | Training Loss | Validation Loss | item-classification_cosine_ap |
597
+ |:----------:|:--------:|:-------------:|:---------------:|:-----------------------------:|
598
+ | 0 | 0 | - | 0.0298 | 0.3925 |
599
+ | 0.2551 | 100 | 0.0162 | - | - |
600
+ | 0.5102 | 200 | 0.0081 | - | - |
601
+ | 0.6378 | 250 | - | 0.0070 | 0.7305 |
602
+ | 0.7653 | 300 | 0.0064 | - | - |
603
+ | 1.0179 | 400 | 0.0049 | - | - |
604
+ | 1.2730 | 500 | 0.0046 | 0.0051 | 0.8504 |
605
+ | 1.5281 | 600 | 0.0038 | - | - |
606
+ | 1.7832 | 700 | 0.0037 | - | - |
607
+ | 1.9107 | 750 | - | 0.0049 | 0.8791 |
608
+ | 2.0357 | 800 | 0.0032 | - | - |
609
+ | 2.2908 | 900 | 0.0032 | - | - |
610
+ | 2.5459 | 1000 | 0.0025 | 0.0046 | 0.9016 |
611
+ | 2.8010 | 1100 | 0.0024 | - | - |
612
+ | 3.0536 | 1200 | 0.0026 | - | - |
613
+ | 3.1811 | 1250 | - | 0.0044 | 0.8947 |
614
+ | 3.3087 | 1300 | 0.0022 | - | - |
615
+ | 3.5638 | 1400 | 0.0019 | - | - |
616
+ | 3.8189 | 1500 | 0.002 | 0.0045 | 0.9053 |
617
+ | 4.0714 | 1600 | 0.002 | - | - |
618
+ | 4.3265 | 1700 | 0.0018 | - | - |
619
+ | **4.4541** | **1750** | **-** | **0.0044** | **0.9106** |
620
+ | 4.5816 | 1800 | 0.0014 | - | - |
621
+ | 4.8367 | 1900 | 0.0017 | - | - |
622
+ | 4.9898 | 1960 | - | 0.0044 | 0.9106 |
623
+
624
+ * The bold row denotes the saved checkpoint.
625
+
626
+ ### Framework Versions
627
+ - Python: 3.10.13
628
+ - Sentence Transformers: 3.3.1
629
+ - Transformers: 4.47.1
630
+ - PyTorch: 2.2.1
631
+ - Accelerate: 1.2.1
632
+ - Datasets: 3.2.0
633
+ - Tokenizers: 0.21.0
634
+
635
+ ## Citation
636
+
637
+ ### BibTeX
638
+
639
+ #### Sentence Transformers
640
+ ```bibtex
641
+ @inproceedings{reimers-2019-sentence-bert,
642
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
643
+ author = "Reimers, Nils and Gurevych, Iryna",
644
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
645
+ month = "11",
646
+ year = "2019",
647
+ publisher = "Association for Computational Linguistics",
648
+ url = "https://arxiv.org/abs/1908.10084",
649
+ }
650
+ ```
651
+
652
+ #### ContrastiveLoss
653
+ ```bibtex
654
+ @inproceedings{hadsell2006dimensionality,
655
+ author={Hadsell, R. and Chopra, S. and LeCun, Y.},
656
+ booktitle={2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06)},
657
+ title={Dimensionality Reduction by Learning an Invariant Mapping},
658
+ year={2006},
659
+ volume={2},
660
+ number={},
661
+ pages={1735-1742},
662
+ doi={10.1109/CVPR.2006.100}
663
+ }
664
+ ```
665
+
666
+ <!--
667
+ ## Glossary
668
+
669
+ *Clearly define terms in order to be accessible across audiences.*
670
+ -->
671
+
672
+ <!--
673
+ ## Model Card Authors
674
+
675
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
676
+ -->
677
+
678
+ <!--
679
+ ## Model Card Contact
680
+
681
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
682
+ -->
config.json ADDED
@@ -0,0 +1,27 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "sergeyzh/rubert-tiny-turbo",
3
+ "architectures": [
4
+ "BertModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "classifier_dropout": null,
8
+ "emb_size": 312,
9
+ "gradient_checkpointing": false,
10
+ "hidden_act": "gelu",
11
+ "hidden_dropout_prob": 0.1,
12
+ "hidden_size": 312,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 600,
15
+ "layer_norm_eps": 1e-12,
16
+ "max_position_embeddings": 2048,
17
+ "model_type": "bert",
18
+ "num_attention_heads": 12,
19
+ "num_hidden_layers": 3,
20
+ "pad_token_id": 0,
21
+ "position_embedding_type": "absolute",
22
+ "torch_dtype": "float32",
23
+ "transformers_version": "4.47.1",
24
+ "type_vocab_size": 2,
25
+ "use_cache": true,
26
+ "vocab_size": 83828
27
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.3.1",
4
+ "transformers": "4.47.1",
5
+ "pytorch": "2.2.1"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:e4be90aadda67dc91695aade427c9b7202ad9e911915f09d2decace07aa7bccd
3
+ size 116781184
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 2048,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "cls_token": {
3
+ "content": "[CLS]",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "mask_token": {
10
+ "content": "[MASK]",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "pad_token": {
17
+ "content": "[PAD]",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "sep_token": {
24
+ "content": "[SEP]",
25
+ "lstrip": false,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "unk_token": {
31
+ "content": "[UNK]",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ }
37
+ }
tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json ADDED
@@ -0,0 +1,65 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "[PAD]",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "[UNK]",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "[CLS]",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "[SEP]",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "4": {
36
+ "content": "[MASK]",
37
+ "lstrip": false,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "clean_up_tokenization_spaces": true,
45
+ "cls_token": "[CLS]",
46
+ "do_basic_tokenize": true,
47
+ "do_lower_case": false,
48
+ "extra_special_tokens": {},
49
+ "mask_token": "[MASK]",
50
+ "max_length": 512,
51
+ "model_max_length": 2048,
52
+ "never_split": null,
53
+ "pad_to_multiple_of": null,
54
+ "pad_token": "[PAD]",
55
+ "pad_token_type_id": 0,
56
+ "padding_side": "right",
57
+ "sep_token": "[SEP]",
58
+ "stride": 0,
59
+ "strip_accents": null,
60
+ "tokenize_chinese_chars": true,
61
+ "tokenizer_class": "BertTokenizer",
62
+ "truncation_side": "right",
63
+ "truncation_strategy": "longest_first",
64
+ "unk_token": "[UNK]"
65
+ }
vocab.txt ADDED
The diff for this file is too large to render. See raw diff