gmunkhtur commited on
Commit
9a58376
·
verified ·
1 Parent(s): 8354d4c

Add new SentenceTransformer model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,944 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:7379
8
+ - loss:MatryoshkaLoss
9
+ - loss:MultipleNegativesRankingLoss
10
+ base_model: sentence-transformers/paraphrase-multilingual-mpnet-base-v2
11
+ widget:
12
+ - source_sentence: ТДБ Онлайн үйлчилгээгээр данс нээхээс гадна өөр ямар нэмэлт боломжуудтай
13
+ вэ?
14
+ sentences:
15
+ - '*-Зээлийн бодит өртөг(жилийн): төгрөг 16.43%
16
+
17
+ Тавигдах шаардлага
18
+
19
+ 18 нас хүрсэн, Монгол улсын иргэн байх
20
+
21
+ Ажил олгогч байгууллагадаа 1 жилээс доошгүй хугацаанд ажилласан байх
22
+
23
+ Хувиараа бизнес эрхлэгчид 1 жил болон түүнээс дээш хугацаанд үйл ажиллагаа явуулсан
24
+ байх
25
+
26
+ Банк, банк бус санхүүгийн байгууллагад анхаарал хандуулах болон чанаргүй зээлийн
27
+ үлдэгдэлгүй байх
28
+
29
+ |№|Хамтран ажиллагч байгууллагууд|Хамтран ажиллагч байгууллагууд|Холбоос|
30
+
31
+ |---|---|---|---|
32
+
33
+ |1|Image|ХАЙБРИД ХАУС ХХК|https://www.facebook.com/HybridHouseLLC/|
34
+
35
+ |2|Image|Түшигт ХОТ Хаус ХХК|https://www.facebook.com/profile.php?id=61550511661989|
36
+
37
+ |3|Image|Эрдэнэс Түмэн Хаус ХХК|https://www.facebook.com/tumenhouse?mibextid=ZbWKwL|
38
+
39
+ |4|Image|Five seasons villa|https://www.facebook.com/profile.php?id=100092997522130&mibextid=LQQJ4d|
40
+
41
+ |5|Image|Zebra Haus|https://www.facebook.com/zebrahausmongolia?mibextid=LQQJ4d|
42
+
43
+ |6|Image|Зуслангийн байшин констракшн ХХК|https://www.facebook.com/Z.BAISHIN?mibextid=LQQJ4d|
44
+
45
+ Энэ хэсэгт зээлийн бодит өртөг, тавигдах шаардлага, хамтран ажиллагч байгууллагуудын
46
+ тухай мэдээлэл багтсан.
47
+
48
+ '
49
+ - '# Үл хөдлөх эд хөрөнгийн зээл
50
+
51
+
52
+ Бизнес эрхлэн явуулах зориулалттай барилга, барилгын тодорхой хэсэг талбай худалдан
53
+ авах, эсвэл шинээр барих, өргөтгөл хийх болон засварлахад зориулагдсэн зээлийг
54
+ бид танд санал болгож байна.
55
+
56
+ Энэ хэсэгт үл хөдлөх эд хөрөнгийн зээлийн зорилгыг тодорхойлсон байна.
57
+
58
+ '
59
+ - 'ТиДиБи Онлайн үйлчилгээгээр данс нээх, хадгаламж барьцаалсан зээл авах, картын
60
+ пин код авах, гүйлгээний загвар үүсгэх, төлбөрөө урьдчилан захиалах, QR кодоор
61
+ баталгаажсан дансны тодорхойлолт болон хуулга авах, зээлийн хүсэлт илгээх, маргаантай
62
+ гүйлгээний хүсэлт илгээх зэрэг нэмэлт боломжуудтай. Гүйлгээ амжилттай хийгдсэн
63
+ даруй цахим хаягт мэдэгдэл ирнэ.
64
+
65
+
66
+ Онлайн багцын жилийн хураамжгүй. Онлайн плас багц мөн хураамжгүй бол Онлайн премиум+ОТР
67
+ багцын жилийн хураамж 5,000 төгрөг. Онлайн багцаар өөрийн нэр дээрх данс хооронд
68
+ гүйлгээ хийхэд шимтгэлгүй, банк дотор болон бусад банкны данс хооронд шилжүүлэг
69
+ хийхэд 100 төгрөгийн шимтгэлтэй.
70
+
71
+
72
+ Үйлчилгээнд бүртгүүлэхийн тулд хүчин төгөлдөр иргэний үнэмлэх эсвэл гадаад паспортын
73
+ хамт өөрт ойр байрлах салбарт хандах боломжтой ба бүртгүүлэх хүсэлтийг урьдчилан
74
+ бөглөж очих боломжтой. ТиДиБи онлайн аппликейшн болон веб хувилбарын гарын авлагыг
75
+ холбоосоор орж үзэх боломжтой.
76
+
77
+ Энэ хэсэгт ТиДиБи Онлайн үйлчилгээний нэмэлт боломжууд, хураамж, бүртгүүлэхэд
78
+ шаардлагатай зүйлсийг тайлбарласан.
79
+
80
+ '
81
+ - source_sentence: KEB HANA BANK-ны SWIFT код нь юу вэ?
82
+ sentences:
83
+ - "\\*20,000₮ -с дээш худалдан авалт бүрд буцаан олголттой бөгөөд сард олгох буцаан\
84
+ \ олголтын дээд хэмжээ 200,000₮ \n\\*\\*3,000,000₮ -с дээш худалдан авалт бүрд\
85
+ \ буцаан олголттой\n\n**Нэмэлт боломжууд:**\n\n* VISA international байгууллагаас\
86
+ \ улирал тутамд зарлагдаж буй хөнгөлөлтийн талаарх дэлгэрэнгүй мэдээллийг [ЭНД](https://www.visa.mn/mn_MN/pay-with-visa/visa-offers-and-perks.html)дарж\
87
+ \ авна уу.\n\n\n## Шимтгэлийн харьцуулалт\n| **Бүтээгдэхүүн** | | **Энгийн нөхцөл**\
88
+ \ | **Багцын нөхцөл** |\n| --- | --- | --- | --- |\n| **Бритто Эйнштейн карт**\
89
+ \ | Картын хураамж | 22,000₮ (4 жил) | Хураамжгүй |\n| Карт хүргэлт | 3,000₮ |\
90
+ \ Хураамжгүй |\n| АТМ-с бэлэн мөнгө авахад | 3,185₮ | Шимтгэлгүй |\n| АТМ-р шилжүүлэг\
91
+ \ хийхэд | 100₮ | Шимтгэлгүй |\n| **Ти Ди Би Онлайн үйлчилгээ** | Гүйлгээний шимтгэл\
92
+ \ | 10,690₮\\* | Шимтгэлгүй |\n| ATM-с QR кодоор бэлэн мөнгө авах шимтгэл | 100₮\
93
+ \ | Шимтгэлгүй |\n| **Жилд төлөх нийт шимтэл, хураамж** | | **22,575₮** | **8,000₮**\
94
+ \ |\n\n*\\*Харилцагчдын дундаж хэрэглээгээр тооцов*\nЭнэ хэсэгт Эйнштейн залуусын\
95
+ \ багцын буцаан олголтын нөхцөл, VISA-ийн хөнгөлөлт, шимтгэлийн харьцуулалтыг\
96
+ \ харуулсан.\n"
97
+ - '* 5,000 төгрөг, түүнтэй тэнцэх бусад валют
98
+
99
+
100
+
101
+ Монголын Худалдаа Хөгжлийн Банк байгууллагуудад зориулсан энгийн хугацаатай хадгаламжийн
102
+ үйлчилгээг санал болгож байна. Энэхүү хадгаламж нь байгууллагын мөнгөн хөрөнгийг
103
+ өсгөх, хамгийн өндөр өгөөжтэй байхад чиглэгдсэн. Хадгаламжийн хугацаа, валютаас
104
+ хамаарч хүүний нөхцөл өөр өөр байх бөгөөд төгрөг, ам.доллар, юань, евро гэсэн
105
+ валютуудаар хадгаламж нээлгэх боломжтой.
106
+
107
+
108
+ Төгрөгийн хугацаатай хадгаламжийн хувьд 1 сараас 24 сар хүртэл хугацаатай байх
109
+ ба хүү нь 8.0%-12.8% байна. Ам.долларын хадгаламж 3 сараас 12 сар хүртэл хугацаатай,
110
+ хүү нь 2.0%-3.2% байна. Юанийн хадгаламж 3 сараас 12 сар хүртэл хугацаатай, хүү
111
+ нь 1.2%-1.8% байна. Еврогийн хадгаламж 3 сараас 12 сар хүртэл хугацаатай, хүү
112
+ нь 1.2%-1.7% байна. Валют бүрийн дансны доод үлдэгдэл харилцан адилгүй байна.
113
+
114
+ Хадгаламжийн данс хаах шимтгэл болон хадгаламжийн ерөнхий мэдээлэл.
115
+
116
+ '
117
+ - "# Корреспондент банк\n\n## Корреспондент банкны жагсаалт\n\n- Ам.доллар\n |\
118
+ \ № | Улс | Банкны нэр | Байршил | SWIFT код |\n | --- | --- | --- | --- | ---\
119
+ \ |\n | 1 | U.S. | THE BANK OF NEW YORK MELLON | NEW YORK, UNITED STATES | IRVTUS3N\
120
+ \ |\n | 2 | FR | NATIXIS | PARIS, FRANCE | NATXFRPPXXX |\n | 3 | KR | KEB HANA\
121
+ \ BANK | SEOUL, KOREA | KOEXKRSE |\n | 4 | KOOKMIN BANK | SEOUL, KOREA | CZNBKRSE\
122
+ \ |\n | 5 | SHINHAN BANK | SEOUL, KOREA | SHBKKRSE |\n | 6 | WOORI BANK | SEOUL,\
123
+ \ KOREA | HVBKKRSE |\n | 7 | CN | INDUSTRIAL AND COMMERCIAL BANK OF CHINA | ERLIANHAOTE,\
124
+ \ CHINA | ICBKCNBJNMA |\n | 8 | BANK OF CHINA LIMTED (HONG KONG) | HONG KONG,\
125
+ \ CHINA | BKCHHKHH |\n | 9 | BANK OF INNER MONGOLIA | HOHHOT, CHINA | HSSYCNBH010\
126
+ \ |\n | 10 | SG | OCBC BANK | SINGAPORE | OCBCSGSG |\n | 11 | DBS BANK LIMITED\
127
+ \ | SINGAPORE | DBSSSGSG |\n | 12 | DE | COMMERZBANK AG | FRANKFURT, GERMANY\
128
+ \ | COBADEFF |\n | 13 | TH | KASIKORNBANK PUBLIC COMPANY LIMITED | BANGKOK, THAILAND\
129
+ \ | KASITHBK |\nХХБ-ны корреспондент банкуудын жагсаалт, тэр дундаа ам.долларын\
130
+ \ данстай банкуудын мэдээлэл.\n"
131
+ - source_sentence: Зээлийн хэмжээ хамгийн ихдээ хэдэн төгрөг хүртэл байж болох вэ?
132
+ sentences:
133
+ - 'Та картаа ПОС терминалд 5 см орчим ойртуулахад гүйлгээ хийгдэнэ.
134
+
135
+
136
+ Терминалын тохиргоо буюу гүйлгээ хийгдэж буй улсын журам, зохицуулалтаас хамаарч
137
+ өндөр дүнтэй гүйлгээг картын ��ИН кодоор баталгаажуулна.
138
+
139
+
140
+ Дараах логонуудтай дэлхийн аль ч улсын ПОС терминалд payWave гүйлгээ хийх боломжтой.
141
+
142
+
143
+ payWave унших боломжгүй үйлчилгээний байгууллагад payWave картын EMV чип болон
144
+ соронзон туузыг ашиглан гүйлгээ хийх боломжтой.
145
+
146
+
147
+ Олон улс руу зорчихын өмнө
148
+
149
+ Картын хүчинтэй хугацаагаа шалгаж, хугацаа дуусах гэж буй бол банкинд хандаж,
150
+ шинээр захиална уу.
151
+
152
+
153
+ Кредит карт болон зээлийн эрхтэй карттай бол зээл төлөгдөж дуусах хугацаа, зээлийн
154
+ лимитийн хугацаа болон картын дуусах хугацаагаа нягтлаарай.
155
+
156
+
157
+ Банкны www.tdbm.mn цахим хуудасны “Мэдээллийн аюулгүй байдлын зөвлөмж” хэсгээс
158
+ картын эрсдэлээс сэргийлэх зөвлөмжүүдтэй сайтар танилцана уу.
159
+
160
+
161
+ Гарч болзошгүй эрсдэлээс сэргийлж картдаа хамтран эзэмшигч, эсвэл итгэмжлэгдсэн
162
+ хүний мэдээллээ банканд бүртгүүлэх боломжтой.
163
+
164
+ PayWave картаар төлбөр хийх, олон улс руу зорчихоос өмнө анхаарах зүйлс.
165
+
166
+ '
167
+ - '# Тээврийн санхүүжилтийн зээлийн эрх
168
+
169
+
170
+ Бид танд Тээвэр зуучлагч компани, Гаалийн байгууллагууд болон Импортлогч байгууллагын
171
+ хоорондын төлбөр, тооцоог санхүүжүүлэх бүтээгдэхүүнийг санал болгож байна.
172
+
173
+
174
+ Үйлчилгээний нөхцөл
175
+
176
+ | **Шугамын зээлийн нөхцөл** | |
177
+
178
+ | --- | --- |
179
+
180
+ | Зээлийн хэмжээ | 500,000,000 (таван зуун сая) төгрөг хүртэл |
181
+
182
+ | Зээлийн хугацаа | 12 сар хүртэл |
183
+
184
+ | Зээлийн хүү | 20.4% хүртэл |
185
+
186
+ | Эргэн төлөлтийн нөхцөл | Нэхэмжлэлийн эсрэг олголтын бүрийн эргэн төлөлт 30-75
187
+ хоног |
188
+
189
+ | Ашиглаагүй зээлийн үлдэгдэлд бодогдох хүү | 0% |
190
+
191
+ | Үндсэн барьцаа хөрөнгө | Бараа материалын үлдэгдэл болон Ложистикийн компани
192
+ дээрх Замд яваа бараа материал байна. |
193
+
194
+
195
+ | **Төлбөрийн баталгаа гаргуулах тохиолдолд баталгааны нөхцөл** | |
196
+
197
+ | --- | --- |
198
+
199
+ | Баталгааны эрсдэлийн шимтгэл | 6% |
200
+
201
+
202
+ Тавигдах шаардлага
203
+
204
+
205
+ **Зээлдэгчид тавигдах шаардлага**
206
+
207
+ Энэ хэсэгт "Тээврийн санхүүжилтийн зээлийн эрх"-ийн үйлчилгээний нөхцөл болон
208
+ зээлдэгчид тавигдах шаардлагыг тайлбарласан байна.
209
+
210
+ '
211
+ - '| Давуу тал |
212
+
213
+ | -----------------------------------------------------------------------------------------------------------------------------------
214
+ |
215
+
216
+ | ОУ-ын үнэт цаасны төвлөрсөн хадгаламжийн төвүүдтэй бодит цагийн горимоор холбогдон
217
+ үнэт цаасны төлбөр тооцоо, хадгалалтыг гүйцэтгэх |
218
+
219
+ | Татварын тооцоолол, суутгал, татварын чөлөөлөлт, сертификат |
220
+
221
+ | Төлбөр тооцоог баталгаажуулан зөрүүг шалган мэдээллэх |
222
+
223
+ | Харилцагчийг үнэт цаасны төлбөр тооцооны  процесс,   компанийн үйл ажиллагаанд
224
+ оролцох талаарх зөвлөмжөөр хангах |
225
+
226
+ | Харилцагчийн хадгалуулж буй үнэт цаасны үлдэгдэл, үнэлгээ, хуулгыг TDB Online-р
227
+ харах боломжтой |
228
+
229
+ Энэ хэсэг нь кастодиан үйлчилгээний давуу талуудыг жагсаасан хэсэг юм.
230
+
231
+ '
232
+ - source_sentence: FATCA-ийн ямар маягтын талаарх мэдээлэл ХХБ-ны МУТС-тэй тэмцэх
233
+ хүрээнд багтдаг вэ?
234
+ sentences:
235
+ - "Wolfsberg Questionnaire\n\nВольфсберг групп нь дэлхийн арван гурван банкны нэгдэл\
236
+ \ бөгөөд санхүүгийн гэмт хэргийн эрсдэлийн менежментийн тогтолцоо, удирдамжийг\
237
+ \ боловсруулах, тэр дундаа харилцагчаа таних, мөнгө угаах, терроризмыг санхүүжүүлэхтэй\
238
+ \ тэмцэх бодлогыг боловсруулахад чиглэдэг. \nДоорх линк дээр даран та бүхэн банкны\
239
+ \ Волфсберг группийн Корреспондент (хамтын ажиллагаатай) банкны асуулгатай танилцах\
240
+ \ боломжтой ба асуулгаас банкны Мөнгө угаах болон терроризмыг санхүүжүүлэхтэй\
241
+ \ тэмцэх хөтөлбөрийн талаар ерөнхий мэдээлэлтэй танилцах боломжтой. [**Энд дарна\
242
+ \ уу**](https://www.tdbm.mn/sites/default/files/2024-11/TDBM%202024.09.09%20CBDDQ%20v1.4%20sign.pdf)\n\
243
+ \nW-8BEN-E FORM\nХХБ-ны МУТС-тэй тэмцэх хүрээнд Вольфсберг Группийн асуулга болон\
244
+ \ FATCA-ийн W-8BEN-E маягтын талаарх мэдээлэл.\n"
245
+ - "# Байгууллагын хадгаламжийн сертификат\nТанд өндөр хүүтэй, бусдад шилжүүлэх,\
246
+ \ худалдах зэргээр чөлөөтэй хөрвөх чадвартай бүтээгдэхүүнийг санал болгож байна.\n\
247
+ \nҮйлчилгээний нөхцөл\n### **Төгрөгийн сертификат**\n\n| **Сертификатын хугацаа**\
248
+ \ | **3 сар** | **6 сар** | **12 сар** |\n| --- | --- | --- | --- |\n| Жилийн\
249
+ \ хүү | 9.6% | 10.6% | 12.5% |\n\n**\\***Гэрээний хугацаанд орлого зарлагын гүйлгээ\
250
+ \ хийхгүй, хугацаа цуцлах боломжгүй. \n\\*\\*3-24 сарын хугацаатай хадгаламжийн\
251
+ \ хувьд санхүүгийн тогтвортой харилцаа үүсгэсэн харилцагчдад хадгаламж шинээр\
252
+ \ нээх болон хадгаламжийн хугацаа сунгах тохиолдолд банкны холбогдох газар, нэгжийн\
253
+ \ зөвшөөрлөөр (Улаанбаатарт 50 сая (50 мянган ам.доллар), Орон нутагт 20 сая (20\
254
+ \ мянган ам. доллар) түүнээс дээш үлдэгдлийн хувьд) хадгаламжийн нийтэд зарласан\
255
+ \ хүүн дээр 0.0%-3.0% хүртэл хүүний урамшууллыг олгож болно.\nБайгууллагын хадгаламжийн\
256
+ \ сертификатын тухай ерөнхий мэдээлэл, төгрөгийн сертификатын нөхцөл.\n"
257
+ - 'Зээл авахын тулд зээлийн өргөдөл, иргэний үнэмлэх, ажил олгогчийн тодорхойлолт,
258
+ хөдөлмөрийн гэрээ, орлогыг баталгаажуулах баримт бичиг, зээлийн гэрээ, худалдах,
259
+ худалдан авах гэрээ эсвэл ажил гүйцэтгэх гэрээ, барьцаанд тавих хөрөнгийн гэрчилгээ,
260
+ газар эзэмших эсвэл газар өмчлөлийн гэрчилгээ, газрын кадастрын зураг, барилга
261
+ ажлын төсөв, эрчим хүчний хэмнэлттэй хувийн сууц болохыг тодорхойлсон дүгнэлт
262
+ зэрэг бичиг баримтыг бүрдүүлэх шаардлагатай. Түүнчлэн, оршин суугаа хаягийн тодорхойлолт,
263
+ гэрлэлтийн гэрчилгээний хуулбар эсвэл гэрлэсэн эсэх лавлагаа, нийгмийн даатгалын
264
+ шимтгэл төлөлтийн талаарх тодорхойлолт, зээлийн барьцаанд тавигдсан эсэх талаарх
265
+ үл хөдлөх хөрөнгийн лавлагааг бүрдүүлэх шаардлагатай. Эдгээр бичиг баримтыг Төрийн
266
+ үйлчилгээний цахим системээс авах боломжтой.
267
+
268
+ Зээл авахад бүрдүүлэх бичиг баримтуудын жагсаалт.
269
+
270
+ '
271
+ - source_sentence: Үй олноор хөнөөх зэвсэг дэлгэрүүлэхийг санхүүжүүлэх нь юунд хохирол
272
+ учруулдаг вэ?
273
+ sentences:
274
+ - '*
275
+
276
+ Харилцагч та онлайн банк үйлчилгээгээр энэхүү картыг захиалсан нөхцөлд картын
277
+ худалдаалах үнээс 20% -ийн хөнгөлөлт эдлэх боломжтой.
278
+
279
+ *20,000₮ -с дээш худалдан авалт бүрд буцаан олголттой бөгөөд сард олгох буцаан
280
+ олголтын дээд хэмжээ 200,000₮
281
+
282
+ Emart -н хувьд :
283
+
284
+ ** 20,000₮ -с дээш худалдан авалт бүрд буцаан олголттой бөгөөд сард олгох буцаан
285
+ олголтын дээд хэмжээ 200,000₮, нэг харилцагчид олгох өдрийн лимит 10,000₮
286
+
287
+ Нэмэлт боломжууд:
288
+
289
+ VISA international байгууллагаас улирал тутамд зарлагдаж буй хөнгөлөлтийн талаарх мэдээллийг
290
+
291
+ ЭНД
292
+
293
+ дарж авна уу.
294
+
295
+ Та өөрийн захиалсан картаа шуудангийн Карт хүргэлтийн үйлчилгээгээр дамжуулан
296
+ хүссэн хаягаараа үнэгүй хүргүүлэн авах боломжтой.
297
+
298
+ Валютын төрөл:USD
299
+
300
+ |Хүү шимтгэл|Хүү шимтгэл|Олон улсын ВИЗА классик карт|Олон улсын ВИЗА классик
301
+ карт|
302
+
303
+ |USD|USD|
304
+
305
+ |Картын хугацаа|Картын хугацаа|4 жил|4 жил|
306
+
307
+ |Худалдаалах үнэ|Салбараар захиалах|25,000 ₮|25,000 ₮|
308
+
309
+ |TDB Online -р захиалах|20,000 ₮|20,000 ₮|
310
+
311
+ |Хүргэлт|Хүргэлт|Үнэгүй|Үнэгүй|
312
+
313
+ Бритто классик картын хүү, шимтгэлийн нөхцөл, USD валютын төрлийн мэдээлэл.
314
+
315
+ '
316
+ - 'Үй олноор хөнөөх зэвсэг дэлгэрүүлэхийг санхүүжүүлэх гэдэг нь Монгол Улсын хууль
317
+ тогтоомж, олон улсын гэрээгээр хориглосон цөмийн, химийн, биологийн эсвэл үйл
318
+ олноор хөнөөх бүх төрлийн зэвсгийг үйлдвэрлэх, ашиглах, худалдах, худалдан авахад
319
+ санхүүгийн дэмжлэг үзүүлэхийг хэлнэ. Үй олноор хөнөөх зэвсэг дэлгэрүүлэхийг санхүүжүүлэх
320
+ нь олон улсын энх тайван, аюулгүй байдал, хүний амь нас, амьдрах орчинд асар их
321
+ хохирол учруулдаг учраас энэ төрлийн гэмт хэргийг санхүүжүүлж болзошгүй мөнгөн
322
+ хөрөнгийн шилжилт хөдөлгөөнийг илрүүлж, таслан зогсоох нь банкны хувьд маш чухал
323
+ юм.
324
+
325
+
326
+ **САНХҮҮГИЙН ГЭМТ ХЭРЭГ ГЭЖ ЮУ ВЭ?**
327
+
328
+ Энэ хэсэгт үй олноор хөнөөх зэвсэг дэлгэрүүлэхийг санхүүжүүлэх гэж юу болох, мөн
329
+ санхүүгийн гэмт хэргийн тухай тодорхойлолтыг оруулсан байна.
330
+
331
+ '
332
+ - 'Тус банк нь Forbes Mongolia Women’s Summit 2022 форумд ерөнхий ивээн тэтгэгчээр
333
+ ажиллаж, Шотланд улсын Эдинбургийн их сургуулийн оюутнуудтай хамтран "Ногоон"
334
+ банк болох талаар судалгаа хийсэн. Visa International-тай хамтран ОУ-ын виза карт
335
+ руу мөнгөн гуйвуулга илгээх Visa Direct болон Visa B2B үйлчилгээнүүдийг Монгол
336
+ Улсын зах зээлд анхлан нэвтрүүлсэн. Britto Cup - 2022 хөл бөмбөгийн аварга шалгаруулах
337
+ тэмцээнийг зохион байгуулж, Britto Эйнштэйн картыг зах зээлд нэвтрүүлсэн.
338
+
339
+
340
+ ХХБ нь Мооdу’s агентлагаас B2, Standard & Poor’s агентлагаас B+ зэрэглэлтэй бөгөөд
341
+ хэтийн төлөв нь тогтвортой үнэлгээтэй. Ногоон зээлийн хөтөлбөртөө ОУ-н эдийн засгийн
342
+ хамтын ажиллагааны банк (IВEC)-с 10 сая ам.долларын санхүүжилт татаж, Visa International
343
+ байгууллагатай хамтын ажиллагаа эхэлсний 20 жилийн ойг тэмдэглэсэн. ОХУ-н тэргүүний
344
+ банк болох Газпромбанктай "Хамтын ажиллагааны гэрээ” байгуулж, "Climate 30+ Ногоон
345
+ Сэргэлтийн Хөтөлбөр”-ийг санаачлан хэрэгжүүлж байна.
346
+
347
+ ХХБ-ны 2022 оны үйл ажиллагаа, хамтын ажиллагаа, зээлжих зэрэглэл, ногоон хөтөлбөрүүдийн
348
+ тухай.
349
+
350
+ '
351
+ pipeline_tag: sentence-similarity
352
+ library_name: sentence-transformers
353
+ metrics:
354
+ - cosine_accuracy@1
355
+ - cosine_accuracy@3
356
+ - cosine_accuracy@5
357
+ - cosine_accuracy@10
358
+ - cosine_precision@1
359
+ - cosine_precision@3
360
+ - cosine_precision@5
361
+ - cosine_precision@10
362
+ - cosine_recall@1
363
+ - cosine_recall@3
364
+ - cosine_recall@5
365
+ - cosine_recall@10
366
+ - cosine_ndcg@10
367
+ - cosine_mrr@10
368
+ - cosine_map@100
369
+ model-index:
370
+ - name: SentenceTransformer based on sentence-transformers/paraphrase-multilingual-mpnet-base-v2
371
+ results:
372
+ - task:
373
+ type: information-retrieval
374
+ name: Information Retrieval
375
+ dataset:
376
+ name: Unknown
377
+ type: unknown
378
+ metrics:
379
+ - type: cosine_accuracy@1
380
+ value: 0.45582655826558266
381
+ name: Cosine Accuracy@1
382
+ - type: cosine_accuracy@3
383
+ value: 0.7051490514905149
384
+ name: Cosine Accuracy@3
385
+ - type: cosine_accuracy@5
386
+ value: 0.7837398373983739
387
+ name: Cosine Accuracy@5
388
+ - type: cosine_accuracy@10
389
+ value: 0.8590785907859079
390
+ name: Cosine Accuracy@10
391
+ - type: cosine_precision@1
392
+ value: 0.45582655826558266
393
+ name: Cosine Precision@1
394
+ - type: cosine_precision@3
395
+ value: 0.2350496838301716
396
+ name: Cosine Precision@3
397
+ - type: cosine_precision@5
398
+ value: 0.15674796747967476
399
+ name: Cosine Precision@5
400
+ - type: cosine_precision@10
401
+ value: 0.08590785907859079
402
+ name: Cosine Precision@10
403
+ - type: cosine_recall@1
404
+ value: 0.45582655826558266
405
+ name: Cosine Recall@1
406
+ - type: cosine_recall@3
407
+ value: 0.7051490514905149
408
+ name: Cosine Recall@3
409
+ - type: cosine_recall@5
410
+ value: 0.7837398373983739
411
+ name: Cosine Recall@5
412
+ - type: cosine_recall@10
413
+ value: 0.8590785907859079
414
+ name: Cosine Recall@10
415
+ - type: cosine_ndcg@10
416
+ value: 0.6606727133436431
417
+ name: Cosine Ndcg@10
418
+ - type: cosine_mrr@10
419
+ value: 0.59675872155547
420
+ name: Cosine Mrr@10
421
+ - type: cosine_map@100
422
+ value: 0.6027289350216068
423
+ name: Cosine Map@100
424
+ ---
425
+
426
+ # SentenceTransformer based on sentence-transformers/paraphrase-multilingual-mpnet-base-v2
427
+
428
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [sentence-transformers/paraphrase-multilingual-mpnet-base-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-mpnet-base-v2). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
429
+
430
+ ## Model Details
431
+
432
+ ### Model Description
433
+ - **Model Type:** Sentence Transformer
434
+ - **Base model:** [sentence-transformers/paraphrase-multilingual-mpnet-base-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-mpnet-base-v2) <!-- at revision 75c57757a97f90ad739aca51fa8bfea0e485a7f2 -->
435
+ - **Maximum Sequence Length:** 128 tokens
436
+ - **Output Dimensionality:** 768 dimensions
437
+ - **Similarity Function:** Cosine Similarity
438
+ <!-- - **Training Dataset:** Unknown -->
439
+ <!-- - **Language:** Unknown -->
440
+ <!-- - **License:** Unknown -->
441
+
442
+ ### Model Sources
443
+
444
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
445
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
446
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
447
+
448
+ ### Full Model Architecture
449
+
450
+ ```
451
+ SentenceTransformer(
452
+ (0): Transformer({'max_seq_length': 128, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
453
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
454
+ )
455
+ ```
456
+
457
+ ## Usage
458
+
459
+ ### Direct Usage (Sentence Transformers)
460
+
461
+ First install the Sentence Transformers library:
462
+
463
+ ```bash
464
+ pip install -U sentence-transformers
465
+ ```
466
+
467
+ Then you can load this model and run inference.
468
+ ```python
469
+ from sentence_transformers import SentenceTransformer
470
+
471
+ # Download from the 🤗 Hub
472
+ model = SentenceTransformer("gmunkhtur/finetuned_tdb_paraphrase-multilingual_mpnet_try2")
473
+ # Run inference
474
+ sentences = [
475
+ 'Үй олноор хөнөөх зэвсэг дэлгэрүүлэхийг санхүүжүүлэх нь юунд хохирол учруулдаг вэ?',
476
+ 'Үй олноор хөнөөх зэвсэг дэлгэрүүлэхийг санхүүжүүлэх гэдэг нь Монгол Улсын хууль тогтоомж, олон улсын гэрээгээр хориглосон цөмийн, химийн, биологийн эсвэл үйл олноор хөнөөх бүх төрлийн зэвсгийг үйлдвэрлэх, ашиглах, худалдах, худалдан авахад санхүүгийн дэмжлэг үзүүлэхийг хэлнэ. Үй олноор хөнөөх зэвсэг дэлгэрүүлэхийг санхүүжүүлэх нь олон улсын энх тайван, аюулгүй байдал, хүний амь нас, амьдрах орчинд асар их хохирол учруулдаг учраас энэ төрлийн гэмт хэргийг санхүүжүүлж болзошгүй мөнгөн хөрөнгийн шилжилт хөдөлгөөнийг илрүүлж, таслан зогсоох нь банкны хувьд маш чухал юм.\n\n**САНХҮҮГИЙН ГЭМТ ХЭРЭГ ГЭЖ ЮУ ВЭ?**\nЭнэ хэсэгт үй олноор хөнөөх зэвсэг дэлгэрүүлэхийг санхүүжүүлэх гэж юу болох, мөн санхүүгийн гэмт хэргийн тухай тодорхойлолтыг оруулсан байна.\n',
477
+ 'Тус банк нь Forbes Mongolia Women’s Summit 2022 форумд ерөнхий ивээн тэтгэгчээр ажиллаж, Шотланд улсын Эдинбургийн их сургуулийн оюутнуудтай хамтран "Ногоон" банк болох талаар судалгаа хийсэн. Visa International-тай хамтран ОУ-ын виза карт руу мөнгөн гуйвуулга илгээх Visa Direct болон Visa B2B үйлчилгээнүүдийг Монгол Улсын зах зээлд анхлан нэвтрүүлсэн. Britto Cup - 2022 хөл бөмбөгийн аварга шалгаруулах тэмцээнийг зохион байгуулж, Britto Эйнштэйн картыг зах зээлд нэвтрүүлсэн.\n\nХХБ нь Мооdу’s агентлагаас B2, Standard & Poor’s агентлагаас B+ зэрэглэлтэй бөгөөд хэтийн төлөв нь тогтвортой үнэлгээтэй. Ногоон зээлийн хөтөлбөртөө ОУ-н эдийн засгийн хамтын ажиллагааны банк (IВEC)-с 10 сая ам.долларын санхүүжилт татаж, Visa International байгууллагатай хамтын ажиллагаа эхэлсний 20 жилийн ойг тэмдэглэсэн. ОХУ-н тэргүүний банк болох Газпромбанктай "Хамтын ажиллагааны гэрээ” байгуулж, "Climate 30+ Ногоон Сэргэлтийн Хөтөлбөр”-ийг санаачлан хэрэгжүүлж байна.\nХХБ-ны 2022 оны үйл ажиллагаа, хамтын ажиллагаа, зээлжих зэрэглэл, ногоон хөтөлбөрүүдийн тухай.\n',
478
+ ]
479
+ embeddings = model.encode(sentences)
480
+ print(embeddings.shape)
481
+ # [3, 768]
482
+
483
+ # Get the similarity scores for the embeddings
484
+ similarities = model.similarity(embeddings, embeddings)
485
+ print(similarities.shape)
486
+ # [3, 3]
487
+ ```
488
+
489
+ <!--
490
+ ### Direct Usage (Transformers)
491
+
492
+ <details><summary>Click to see the direct usage in Transformers</summary>
493
+
494
+ </details>
495
+ -->
496
+
497
+ <!--
498
+ ### Downstream Usage (Sentence Transformers)
499
+
500
+ You can finetune this model on your own dataset.
501
+
502
+ <details><summary>Click to expand</summary>
503
+
504
+ </details>
505
+ -->
506
+
507
+ <!--
508
+ ### Out-of-Scope Use
509
+
510
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
511
+ -->
512
+
513
+ ## Evaluation
514
+
515
+ ### Metrics
516
+
517
+ #### Information Retrieval
518
+
519
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
520
+
521
+ | Metric | Value |
522
+ |:--------------------|:-----------|
523
+ | cosine_accuracy@1 | 0.4558 |
524
+ | cosine_accuracy@3 | 0.7051 |
525
+ | cosine_accuracy@5 | 0.7837 |
526
+ | cosine_accuracy@10 | 0.8591 |
527
+ | cosine_precision@1 | 0.4558 |
528
+ | cosine_precision@3 | 0.235 |
529
+ | cosine_precision@5 | 0.1567 |
530
+ | cosine_precision@10 | 0.0859 |
531
+ | cosine_recall@1 | 0.4558 |
532
+ | cosine_recall@3 | 0.7051 |
533
+ | cosine_recall@5 | 0.7837 |
534
+ | cosine_recall@10 | 0.8591 |
535
+ | **cosine_ndcg@10** | **0.6607** |
536
+ | cosine_mrr@10 | 0.5968 |
537
+ | cosine_map@100 | 0.6027 |
538
+
539
+ <!--
540
+ ## Bias, Risks and Limitations
541
+
542
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
543
+ -->
544
+
545
+ <!--
546
+ ### Recommendations
547
+
548
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
549
+ -->
550
+
551
+ ## Training Details
552
+
553
+ ### Training Dataset
554
+
555
+ #### Unnamed Dataset
556
+
557
+ * Size: 7,379 training samples
558
+ * Columns: <code>sentence_0</code> and <code>sentence_1</code>
559
+ * Approximate statistics based on the first 1000 samples:
560
+ | | sentence_0 | sentence_1 |
561
+ |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
562
+ | type | string | string |
563
+ | details | <ul><li>min: 8 tokens</li><li>mean: 22.09 tokens</li><li>max: 94 tokens</li></ul> | <ul><li>min: 31 tokens</li><li>mean: 125.54 tokens</li><li>max: 128 tokens</li></ul> |
564
+ * Samples:
565
+ | sentence_0 | sentence_1 |
566
+ |:-------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
567
+ | <code>Жуниор багц хэдэн насны хүүхдэд зориулагдсан бэ?</code> | <code>20,000₮ -с дээш худалдан авалт бүрд буцаан олголттой бөгөөд сард олгох буцаан олголтын дээд хэмжээ 200,000₮<br><br>**Нэмэлт боломжууд:**<br><br>* VISA international байгууллагаас улирал тутамд зарлагдаж буй хөнгөлөлтийн талаарх дэлгэрэнгүй мэдээллийг [ЭНД](https://www.visa.mn/mn_MN/pay-with-visa/visa-offers-and-perks.html)дарж авна уу.<br>### Жуниор багц 13-18 нас<br><br>**Дараах байгууллагуудын ХХБ-ны пос төхөөрөмж дээр уншуулснаар буцаан олголт эдлэх боломжтой.**<br>Кидс багцын хөнгөлөлт урамшууллын жагсаалтын дараа Жуниор багцын хөнгөлөлт урамшуулал эхэлж байна.<br></code> |
568
+ | <code>Байгууллагын багцуудын давуу талуудад шимтгэл хураамж төлөхгүй байх зэрэг ордог уу?</code> | <code>Монголын Худалдаа Хөгжлийн Банк байгууллагуудад зориулж төлбөр тооцооны үйлчилгээг багцалсан дөрвөн төрлийн багц бүтээгдэхүүн санал болгож байна. Эдгээр багцууд нь санхүүгийн хэрэгцээт үйлчилгээг нэг дор авах, байгууллагын хэрэглээнд тохирсон төрлийг сонгох, санхүүгийн гүйлгээнд зарцуулах цагийг хэмнэх, шимтгэл хураамж төлөхгүй байх зэрэг давуу талуудтай. Мөн санхүүгийн бүртгэл тооцоог хялбаршуулах, цахим банк руу шилжих, гүйлгээг цахимаар зайнаас шийдэх, цахим үйлчилгээг хөнгөлөлттэй нөхцөлөөр авах, санхүүгийн зөвлөх үйлчилгээ авах боломжуудыг олгодог.<br>Энэ хэсэгт байгууллагын багц бүтээгдэхүүний гол санаа, давуу талуудыг тодорхойлсон.<br></code> |
569
+ | <code>Хүүхдийн багц гэж юу вэ?</code> | <code># Хүүхдийн багц<br>Таны хүүхдийн санхүүгийн хэрэгцээнд тохирсон үйлчилгээг нэг дор багтаасан<br>Хүүхдийн санхүүгийн багцын тухай ерөнхий танилцуулга.<br></code> |
570
+ * Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
571
+ ```json
572
+ {
573
+ "loss": "MultipleNegativesRankingLoss",
574
+ "matryoshka_dims": [
575
+ 768,
576
+ 512,
577
+ 256,
578
+ 128,
579
+ 64
580
+ ],
581
+ "matryoshka_weights": [
582
+ 1,
583
+ 1,
584
+ 1,
585
+ 1,
586
+ 1
587
+ ],
588
+ "n_dims_per_step": -1
589
+ }
590
+ ```
591
+
592
+ ### Training Hyperparameters
593
+ #### Non-Default Hyperparameters
594
+
595
+ - `eval_strategy`: steps
596
+ - `per_device_train_batch_size`: 16
597
+ - `per_device_eval_batch_size`: 16
598
+ - `num_train_epochs`: 30
599
+ - `multi_dataset_batch_sampler`: round_robin
600
+
601
+ #### All Hyperparameters
602
+ <details><summary>Click to expand</summary>
603
+
604
+ - `overwrite_output_dir`: False
605
+ - `do_predict`: False
606
+ - `eval_strategy`: steps
607
+ - `prediction_loss_only`: True
608
+ - `per_device_train_batch_size`: 16
609
+ - `per_device_eval_batch_size`: 16
610
+ - `per_gpu_train_batch_size`: None
611
+ - `per_gpu_eval_batch_size`: None
612
+ - `gradient_accumulation_steps`: 1
613
+ - `eval_accumulation_steps`: None
614
+ - `torch_empty_cache_steps`: None
615
+ - `learning_rate`: 5e-05
616
+ - `weight_decay`: 0.0
617
+ - `adam_beta1`: 0.9
618
+ - `adam_beta2`: 0.999
619
+ - `adam_epsilon`: 1e-08
620
+ - `max_grad_norm`: 1
621
+ - `num_train_epochs`: 30
622
+ - `max_steps`: -1
623
+ - `lr_scheduler_type`: linear
624
+ - `lr_scheduler_kwargs`: {}
625
+ - `warmup_ratio`: 0.0
626
+ - `warmup_steps`: 0
627
+ - `log_level`: passive
628
+ - `log_level_replica`: warning
629
+ - `log_on_each_node`: True
630
+ - `logging_nan_inf_filter`: True
631
+ - `save_safetensors`: True
632
+ - `save_on_each_node`: False
633
+ - `save_only_model`: False
634
+ - `restore_callback_states_from_checkpoint`: False
635
+ - `no_cuda`: False
636
+ - `use_cpu`: False
637
+ - `use_mps_device`: False
638
+ - `seed`: 42
639
+ - `data_seed`: None
640
+ - `jit_mode_eval`: False
641
+ - `use_ipex`: False
642
+ - `bf16`: False
643
+ - `fp16`: False
644
+ - `fp16_opt_level`: O1
645
+ - `half_precision_backend`: auto
646
+ - `bf16_full_eval`: False
647
+ - `fp16_full_eval`: False
648
+ - `tf32`: None
649
+ - `local_rank`: 0
650
+ - `ddp_backend`: None
651
+ - `tpu_num_cores`: None
652
+ - `tpu_metrics_debug`: False
653
+ - `debug`: []
654
+ - `dataloader_drop_last`: False
655
+ - `dataloader_num_workers`: 0
656
+ - `dataloader_prefetch_factor`: None
657
+ - `past_index`: -1
658
+ - `disable_tqdm`: False
659
+ - `remove_unused_columns`: True
660
+ - `label_names`: None
661
+ - `load_best_model_at_end`: False
662
+ - `ignore_data_skip`: False
663
+ - `fsdp`: []
664
+ - `fsdp_min_num_params`: 0
665
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
666
+ - `fsdp_transformer_layer_cls_to_wrap`: None
667
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
668
+ - `deepspeed`: None
669
+ - `label_smoothing_factor`: 0.0
670
+ - `optim`: adamw_torch
671
+ - `optim_args`: None
672
+ - `adafactor`: False
673
+ - `group_by_length`: False
674
+ - `length_column_name`: length
675
+ - `ddp_find_unused_parameters`: None
676
+ - `ddp_bucket_cap_mb`: None
677
+ - `ddp_broadcast_buffers`: False
678
+ - `dataloader_pin_memory`: True
679
+ - `dataloader_persistent_workers`: False
680
+ - `skip_memory_metrics`: True
681
+ - `use_legacy_prediction_loop`: False
682
+ - `push_to_hub`: False
683
+ - `resume_from_checkpoint`: None
684
+ - `hub_model_id`: None
685
+ - `hub_strategy`: every_save
686
+ - `hub_private_repo`: None
687
+ - `hub_always_push`: False
688
+ - `gradient_checkpointing`: False
689
+ - `gradient_checkpointing_kwargs`: None
690
+ - `include_inputs_for_metrics`: False
691
+ - `include_for_metrics`: []
692
+ - `eval_do_concat_batches`: True
693
+ - `fp16_backend`: auto
694
+ - `push_to_hub_model_id`: None
695
+ - `push_to_hub_organization`: None
696
+ - `mp_parameters`:
697
+ - `auto_find_batch_size`: False
698
+ - `full_determinism`: False
699
+ - `torchdynamo`: None
700
+ - `ray_scope`: last
701
+ - `ddp_timeout`: 1800
702
+ - `torch_compile`: False
703
+ - `torch_compile_backend`: None
704
+ - `torch_compile_mode`: None
705
+ - `dispatch_batches`: None
706
+ - `split_batches`: None
707
+ - `include_tokens_per_second`: False
708
+ - `include_num_input_tokens_seen`: False
709
+ - `neftune_noise_alpha`: None
710
+ - `optim_target_modules`: None
711
+ - `batch_eval_metrics`: False
712
+ - `eval_on_start`: False
713
+ - `use_liger_kernel`: False
714
+ - `eval_use_gather_object`: False
715
+ - `average_tokens_across_devices`: False
716
+ - `prompts`: None
717
+ - `batch_sampler`: batch_sampler
718
+ - `multi_dataset_batch_sampler`: round_robin
719
+
720
+ </details>
721
+
722
+ ### Training Logs
723
+ <details><summary>Click to expand</summary>
724
+
725
+ | Epoch | Step | Training Loss | cosine_ndcg@10 |
726
+ |:-------:|:-----:|:-------------:|:--------------:|
727
+ | 0.2165 | 100 | - | 0.2884 |
728
+ | 0.4329 | 200 | - | 0.3526 |
729
+ | 0.6494 | 300 | - | 0.3945 |
730
+ | 0.8658 | 400 | - | 0.4242 |
731
+ | 1.0 | 462 | - | 0.4493 |
732
+ | 1.0823 | 500 | 5.6067 | 0.4537 |
733
+ | 1.2987 | 600 | - | 0.4756 |
734
+ | 1.5152 | 700 | - | 0.4870 |
735
+ | 1.7316 | 800 | - | 0.4974 |
736
+ | 1.9481 | 900 | - | 0.5075 |
737
+ | 2.0 | 924 | - | 0.5083 |
738
+ | 2.1645 | 1000 | 2.6069 | 0.5131 |
739
+ | 2.3810 | 1100 | - | 0.5232 |
740
+ | 2.5974 | 1200 | - | 0.5258 |
741
+ | 2.8139 | 1300 | - | 0.5393 |
742
+ | 3.0 | 1386 | - | 0.5263 |
743
+ | 3.0303 | 1400 | - | 0.5339 |
744
+ | 3.2468 | 1500 | 1.7588 | 0.5495 |
745
+ | 3.4632 | 1600 | - | 0.5509 |
746
+ | 3.6797 | 1700 | - | 0.5477 |
747
+ | 3.8961 | 1800 | - | 0.5595 |
748
+ | 4.0 | 1848 | - | 0.5659 |
749
+ | 4.1126 | 1900 | - | 0.5714 |
750
+ | 4.3290 | 2000 | 1.2665 | 0.5599 |
751
+ | 4.5455 | 2100 | - | 0.5617 |
752
+ | 4.7619 | 2200 | - | 0.5656 |
753
+ | 4.9784 | 2300 | - | 0.5681 |
754
+ | 5.0 | 2310 | - | 0.5671 |
755
+ | 5.1948 | 2400 | - | 0.5752 |
756
+ | 5.4113 | 2500 | 0.8418 | 0.5753 |
757
+ | 5.6277 | 2600 | - | 0.5787 |
758
+ | 5.8442 | 2700 | - | 0.5729 |
759
+ | 6.0 | 2772 | - | 0.5815 |
760
+ | 6.0606 | 2800 | - | 0.5760 |
761
+ | 6.2771 | 2900 | - | 0.5788 |
762
+ | 6.4935 | 3000 | 0.7279 | 0.5870 |
763
+ | 6.7100 | 3100 | - | 0.5859 |
764
+ | 6.9264 | 3200 | - | 0.5887 |
765
+ | 7.0 | 3234 | - | 0.5953 |
766
+ | 7.1429 | 3300 | - | 0.5966 |
767
+ | 7.3593 | 3400 | - | 0.5972 |
768
+ | 7.5758 | 3500 | 0.6135 | 0.5979 |
769
+ | 7.7922 | 3600 | - | 0.6022 |
770
+ | 8.0 | 3696 | - | 0.6082 |
771
+ | 8.0087 | 3700 | - | 0.6069 |
772
+ | 8.2251 | 3800 | - | 0.6030 |
773
+ | 8.4416 | 3900 | - | 0.6049 |
774
+ | 8.6580 | 4000 | 0.4973 | 0.6058 |
775
+ | 8.8745 | 4100 | - | 0.6108 |
776
+ | 9.0 | 4158 | - | 0.6125 |
777
+ | 9.0909 | 4200 | - | 0.6055 |
778
+ | 9.3074 | 4300 | - | 0.6167 |
779
+ | 9.5238 | 4400 | - | 0.6117 |
780
+ | 9.7403 | 4500 | 0.4578 | 0.6109 |
781
+ | 9.9567 | 4600 | - | 0.6108 |
782
+ | 10.0 | 4620 | - | 0.6107 |
783
+ | 10.1732 | 4700 | - | 0.6200 |
784
+ | 10.3896 | 4800 | - | 0.6195 |
785
+ | 10.6061 | 4900 | - | 0.6182 |
786
+ | 10.8225 | 5000 | 0.3861 | 0.6202 |
787
+ | 11.0 | 5082 | - | 0.6206 |
788
+ | 11.0390 | 5100 | - | 0.6185 |
789
+ | 11.2554 | 5200 | - | 0.6209 |
790
+ | 11.4719 | 5300 | - | 0.6234 |
791
+ | 11.6883 | 5400 | - | 0.6210 |
792
+ | 11.9048 | 5500 | 0.3627 | 0.6244 |
793
+ | 12.0 | 5544 | - | 0.6277 |
794
+ | 12.1212 | 5600 | - | 0.6295 |
795
+ | 12.3377 | 5700 | - | 0.6249 |
796
+ | 12.5541 | 5800 | - | 0.6249 |
797
+ | 12.7706 | 5900 | - | 0.6320 |
798
+ | 12.9870 | 6000 | 0.335 | 0.6346 |
799
+ | 13.0 | 6006 | - | 0.6348 |
800
+ | 13.2035 | 6100 | - | 0.6350 |
801
+ | 13.4199 | 6200 | - | 0.6307 |
802
+ | 13.6364 | 6300 | - | 0.6312 |
803
+ | 13.8528 | 6400 | - | 0.6365 |
804
+ | 14.0 | 6468 | - | 0.6374 |
805
+ | 14.0693 | 6500 | 0.3094 | 0.6352 |
806
+ | 14.2857 | 6600 | - | 0.6360 |
807
+ | 14.5022 | 6700 | - | 0.6372 |
808
+ | 14.7186 | 6800 | - | 0.6339 |
809
+ | 14.9351 | 6900 | - | 0.6336 |
810
+ | 15.0 | 6930 | - | 0.6343 |
811
+ | 15.1515 | 7000 | 0.2526 | 0.6388 |
812
+ | 15.3680 | 7100 | - | 0.6410 |
813
+ | 15.5844 | 7200 | - | 0.6382 |
814
+ | 15.8009 | 7300 | - | 0.6381 |
815
+ | 16.0 | 7392 | - | 0.6393 |
816
+ | 16.0173 | 7400 | - | 0.6380 |
817
+ | 16.2338 | 7500 | 0.2287 | 0.6377 |
818
+ | 16.4502 | 7600 | - | 0.6366 |
819
+ | 16.6667 | 7700 | - | 0.6361 |
820
+ | 16.8831 | 7800 | - | 0.6362 |
821
+ | 17.0 | 7854 | - | 0.6438 |
822
+ | 17.0996 | 7900 | - | 0.6380 |
823
+ | 17.3160 | 8000 | 0.2296 | 0.6395 |
824
+ | 17.5325 | 8100 | - | 0.6344 |
825
+ | 17.7489 | 8200 | - | 0.6357 |
826
+ | 17.9654 | 8300 | - | 0.6363 |
827
+ | 18.0 | 8316 | - | 0.6379 |
828
+ | 18.1818 | 8400 | - | 0.6404 |
829
+ | 18.3983 | 8500 | 0.2409 | 0.6432 |
830
+ | 18.6147 | 8600 | - | 0.6433 |
831
+ | 18.8312 | 8700 | - | 0.6448 |
832
+ | 19.0 | 8778 | - | 0.6431 |
833
+ | 19.0476 | 8800 | - | 0.6453 |
834
+ | 19.2641 | 8900 | - | 0.6452 |
835
+ | 19.4805 | 9000 | 0.2028 | 0.6460 |
836
+ | 19.6970 | 9100 | - | 0.6469 |
837
+ | 19.9134 | 9200 | - | 0.6509 |
838
+ | 20.0 | 9240 | - | 0.6513 |
839
+ | 20.1299 | 9300 | - | 0.6519 |
840
+ | 20.3463 | 9400 | - | 0.6472 |
841
+ | 20.5628 | 9500 | 0.2057 | 0.6503 |
842
+ | 20.7792 | 9600 | - | 0.6511 |
843
+ | 20.9957 | 9700 | - | 0.6549 |
844
+ | 21.0 | 9702 | - | 0.6552 |
845
+ | 21.2121 | 9800 | - | 0.6499 |
846
+ | 21.4286 | 9900 | - | 0.6456 |
847
+ | 21.6450 | 10000 | 0.2211 | 0.6465 |
848
+ | 21.8615 | 10100 | - | 0.6509 |
849
+ | 22.0 | 10164 | - | 0.6528 |
850
+ | 22.0779 | 10200 | - | 0.6539 |
851
+ | 22.2944 | 10300 | - | 0.6505 |
852
+ | 22.5108 | 10400 | - | 0.6526 |
853
+ | 22.7273 | 10500 | 0.1749 | 0.6530 |
854
+ | 22.9437 | 10600 | - | 0.6545 |
855
+ | 23.0 | 10626 | - | 0.6554 |
856
+ | 23.1602 | 10700 | - | 0.6532 |
857
+ | 23.3766 | 10800 | - | 0.6524 |
858
+ | 23.5931 | 10900 | - | 0.6531 |
859
+ | 23.8095 | 11000 | 0.1731 | 0.6550 |
860
+ | 24.0 | 11088 | - | 0.6563 |
861
+ | 24.0260 | 11100 | - | 0.6569 |
862
+ | 24.2424 | 11200 | - | 0.6563 |
863
+ | 24.4589 | 11300 | - | 0.6576 |
864
+ | 24.6753 | 11400 | - | 0.6569 |
865
+ | 24.8918 | 11500 | 0.1763 | 0.6558 |
866
+ | 25.0 | 11550 | - | 0.6560 |
867
+ | 25.1082 | 11600 | - | 0.6566 |
868
+ | 25.3247 | 11700 | - | 0.6573 |
869
+ | 25.5411 | 11800 | - | 0.6586 |
870
+ | 25.7576 | 11900 | - | 0.6577 |
871
+ | 25.9740 | 12000 | 0.1569 | 0.6595 |
872
+ | 26.0 | 12012 | - | 0.6591 |
873
+ | 26.1905 | 12100 | - | 0.6585 |
874
+ | 26.4069 | 12200 | - | 0.6607 |
875
+
876
+ </details>
877
+
878
+ ### Framework Versions
879
+ - Python: 3.11.11
880
+ - Sentence Transformers: 3.4.1
881
+ - Transformers: 4.48.3
882
+ - PyTorch: 2.5.1+cu124
883
+ - Accelerate: 1.3.0
884
+ - Datasets: 3.3.0
885
+ - Tokenizers: 0.21.0
886
+
887
+ ## Citation
888
+
889
+ ### BibTeX
890
+
891
+ #### Sentence Transformers
892
+ ```bibtex
893
+ @inproceedings{reimers-2019-sentence-bert,
894
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
895
+ author = "Reimers, Nils and Gurevych, Iryna",
896
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
897
+ month = "11",
898
+ year = "2019",
899
+ publisher = "Association for Computational Linguistics",
900
+ url = "https://arxiv.org/abs/1908.10084",
901
+ }
902
+ ```
903
+
904
+ #### MatryoshkaLoss
905
+ ```bibtex
906
+ @misc{kusupati2024matryoshka,
907
+ title={Matryoshka Representation Learning},
908
+ author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
909
+ year={2024},
910
+ eprint={2205.13147},
911
+ archivePrefix={arXiv},
912
+ primaryClass={cs.LG}
913
+ }
914
+ ```
915
+
916
+ #### MultipleNegativesRankingLoss
917
+ ```bibtex
918
+ @misc{henderson2017efficient,
919
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
920
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
921
+ year={2017},
922
+ eprint={1705.00652},
923
+ archivePrefix={arXiv},
924
+ primaryClass={cs.CL}
925
+ }
926
+ ```
927
+
928
+ <!--
929
+ ## Glossary
930
+
931
+ *Clearly define terms in order to be accessible across audiences.*
932
+ -->
933
+
934
+ <!--
935
+ ## Model Card Authors
936
+
937
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
938
+ -->
939
+
940
+ <!--
941
+ ## Model Card Contact
942
+
943
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
944
+ -->
config.json ADDED
@@ -0,0 +1,29 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "finetuned_tdb_paraphrase-multilingual_mpnet_try2",
3
+ "architectures": [
4
+ "XLMRobertaModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "bos_token_id": 0,
8
+ "classifier_dropout": null,
9
+ "eos_token_id": 2,
10
+ "gradient_checkpointing": false,
11
+ "hidden_act": "gelu",
12
+ "hidden_dropout_prob": 0.1,
13
+ "hidden_size": 768,
14
+ "initializer_range": 0.02,
15
+ "intermediate_size": 3072,
16
+ "layer_norm_eps": 1e-05,
17
+ "max_position_embeddings": 514,
18
+ "model_type": "xlm-roberta",
19
+ "num_attention_heads": 12,
20
+ "num_hidden_layers": 12,
21
+ "output_past": true,
22
+ "pad_token_id": 1,
23
+ "position_embedding_type": "absolute",
24
+ "torch_dtype": "float32",
25
+ "transformers_version": "4.48.3",
26
+ "type_vocab_size": 1,
27
+ "use_cache": true,
28
+ "vocab_size": 250002
29
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.4.1",
4
+ "transformers": "4.48.3",
5
+ "pytorch": "2.5.1+cu124"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:87add7ea6d17ad8bc52e12e6064b52af51934a1dcbf2cff5d34830d8593f1ce0
3
+ size 1112197096
modules.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ }
14
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 128,
3
+ "do_lower_case": false
4
+ }
sentencepiece.bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
3
+ size 5069051
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cad551d5600a84242d0973327029452a1e3672ba6313c2a3c3d69c4310e12719
3
+ size 17082987
tokenizer_config.json ADDED
@@ -0,0 +1,62 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": false,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "extra_special_tokens": {},
49
+ "mask_token": "<mask>",
50
+ "max_length": 128,
51
+ "model_max_length": 128,
52
+ "pad_to_multiple_of": null,
53
+ "pad_token": "<pad>",
54
+ "pad_token_type_id": 0,
55
+ "padding_side": "right",
56
+ "sep_token": "</s>",
57
+ "stride": 0,
58
+ "tokenizer_class": "XLMRobertaTokenizer",
59
+ "truncation_side": "right",
60
+ "truncation_strategy": "longest_first",
61
+ "unk_token": "<unk>"
62
+ }