Add new SentenceTransformer model
Browse files- .gitattributes +1 -0
- 1_Pooling/config.json +10 -0
- README.md +568 -0
- config.json +28 -0
- config_sentence_transformers.json +10 -0
- model.safetensors +3 -0
- modules.json +20 -0
- sentence_bert_config.json +4 -0
- special_tokens_map.json +51 -0
- tokenizer.json +3 -0
- tokenizer_config.json +62 -0
.gitattributes
CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
|
|
33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
|
|
|
33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
36 |
+
tokenizer.json filter=lfs diff=lfs merge=lfs -text
|
1_Pooling/config.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"word_embedding_dimension": 1024,
|
3 |
+
"pooling_mode_cls_token": true,
|
4 |
+
"pooling_mode_mean_tokens": false,
|
5 |
+
"pooling_mode_max_tokens": false,
|
6 |
+
"pooling_mode_mean_sqrt_len_tokens": false,
|
7 |
+
"pooling_mode_weightedmean_tokens": false,
|
8 |
+
"pooling_mode_lasttoken": false,
|
9 |
+
"include_prompt": true
|
10 |
+
}
|
README.md
ADDED
@@ -0,0 +1,568 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
tags:
|
3 |
+
- sentence-transformers
|
4 |
+
- sentence-similarity
|
5 |
+
- feature-extraction
|
6 |
+
- generated_from_trainer
|
7 |
+
- dataset_size:451949
|
8 |
+
- loss:CachedMultipleNegativesRankingLoss
|
9 |
+
base_model: BAAI/bge-m3
|
10 |
+
widget:
|
11 |
+
- source_sentence: 사설묘지의 관리방법에 대한 27.9퍼센트의 견해에 근거하면 모든 묘지는 어떻게 관리해야 해?
|
12 |
+
sentences:
|
13 |
+
- '(10) 공원묘지의 활성화 방안
|
14 |
+
|
15 |
+
□ 문제점
|
16 |
+
|
17 |
+
공원묘지의 재정비, 활성화는 시급하고 적절한 방안이나 법률에는 규정이 없다. □ 개선방안
|
18 |
+
|
19 |
+
첫째 공원묘지 중 무연고 분묘는 절차를 거쳐 화장을 하고 그 골분을 묘지 내 봉안소로 안치하고 분묘자리는 자연장지 또는 다른 장지로 활용한다.
|
20 |
+
둘째 장사법이 정한 분묘기간보다 이전인 60년 이상 된 묘지에 대해서는 적극적으로 개장을 유도한다. 다만, 연고자를 찾지 못하는 경우에는 무연고
|
21 |
+
자에 준하여 처리할 수 있는 규정을 두어 처리한다. (11) 사설묘지의 조성기준의 포괄적 위임
|
22 |
+
|
23 |
+
□ 문제점
|
24 |
+
|
25 |
+
법 제14조(사설묘지의 설치 등) 제6항은 “사설묘지의 설치면적, 분묘의 형태, 설치장소, 그 밖의 설치기준 등에 관하여 필요한 사항은 대통령령으로
|
26 |
+
정한다.” 라고 포괄적으로 위임을 하고 있다. 그러나 대통령령에 의한 [별표]에서 종중이나 문중의 묘지와 봉안묘의 설치 수와 특히 종교단체의
|
27 |
+
봉안묘의 설치수가 각 1개소로 규정하는 것은 대단히 중요한 내용으로 법률에 직접 규정해야 한다는 의견이 있다. □ 개선방안
|
28 |
+
|
29 |
+
사설묘지의 조성기준 중 사설묘지, 사설봉안당 등 중요한 사항은 법률로 정하는 것이 합리적이다. * 의견수렴 결과
|
30 |
+
|
31 |
+
(2-1-1) 묘지의 설치 제한(법 제17조)
|
32 |
+
|
33 |
+
장사법은 ‘묘지’의 설치와 지한은 ‘화장장과 봉안당, 자연장’과 동일하게 규정하고 있어 설치를 어렵게 한다는 의견이 있는데, 이에 대한 응답으로는
|
34 |
+
묘지, 화장장, 봉안당, 자연장은 성격이 다르므로 구분하여 규정해야 한다는 의견이 전체의 84.1%로 현행대로 좋다는 의견 15.9%보다 월등히
|
35 |
+
높게 나타났다. (2-2-1) 개인소유 토지의 묘지조성
|
36 |
+
|
37 |
+
개인이 소유한 토지에 ‘사설묘지’를 조성하고 임의로 매장하는 것이 적절한가에 대한 응답으로는 사유지라도 임의로 설치하는 것은 제한해야 한다는
|
38 |
+
의견이 전체의 68.8%로 가장 높게 나타났다. (2-3-1) 묘지의 성격 구분(법 제14조)-중복
|
39 |
+
|
40 |
+
법 제14조에 규정한 종중, 문중묘지, 법인묘지 규정에서 종중과 문중, 법인의 성격을 구체적으로 구분해야 한다는 의견에 대해서는 더 구체적으로
|
41 |
+
규정해야 한다는 의견이 전체의 63.1%로 가장 높게 나타났다. (2-4-1) 묘지와 상석 등의 규모, 수
|
42 |
+
|
43 |
+
추모문화와 관습은 지역, 문화, 관습, 종교에 따라 차이가 있는바, 묘지와 상석 등의 규모, 수를 법률로 정하는 것은 무리라는 의견이 있는데,
|
44 |
+
이에 대한 응답으로는 법률에 구체적으로 규정해야 한다는 의견이 전체의 62.1%로 가장 높게 나타났다. (2-5-1) 분묘의 설치기간(법 제19조)
|
45 |
+
|
46 |
+
장사법은 설치기간을 15년에서 다시 15년씩 3회 연장하여 총 60년을 사용할 수 있게 규정하고 있는데, 이에 대해서는 기간을 단축해야 한다는
|
47 |
+
의견이 전체의 40.6%로 가장 높게 나타났고, 그 뒤를 적절한 규정이라는 의견과 제한자체가 필요없다는 의견이 함께 21.9%를 차지했다.
|
48 |
+
(2-5-2) 사설묘지의 관리방법
|
49 |
+
|
50 |
+
사설묘지의 관리방법이 모호하여 시행가능성이 없다는 의견이 있는데, 이에 대해서는 묘지 설치 및 이전 등의 신고를 강제화하고 위반 시 벌칙을
|
51 |
+
강화해야 한다는 의견이 전체의 39.3%로 가장 높게 나타났으며, 그 다음으로는 모든 묘지를 전산화하여 관리해야 한다는 의견이 27.9%로
|
52 |
+
두 번째로 높게 나타났다.'
|
53 |
+
- 본고는 정부를 단일한 의사결정주체로 보기보다는 유인체계에 민감한 개인들로 구성된 조직이라는 인식 하에 정부실패를 해결하기 위한 방안으로 유인체계
|
54 |
+
설계의 중요성을 짚어보고 있다. 기존 경제학에서는 시장실패 문제에 대해 시장참여자의 유인체계가 강조되었는데, 감독실패와 같은 정부실패 문제에
|
55 |
+
대해서도 규제·감독권자의 유인체계를 중심으로 해결방안을 모색할 수 있을 것이다. 여기서는 주인-대리인(principal-agent) 모형의
|
56 |
+
관점에서 규제·감독권자의 의사결정이 감독권한을 위임한 국민(납세자·유권자)의 이익에 배치될 수 있음을 설명하고 있다. 국민과 규제·감독권자
|
57 |
+
사이에는 정보비대칭이 있으며, 규제·감독권자와 금융기관 사이에도 정보비대칭이 있다. 여기서 감독권자는 금융안정 등과 같이 국민의 이익에 부합하는
|
58 |
+
목적을 달성하기 위해 금융기관을 감독할 책무를 부여받고 있다. 한편, 개별 국민은 정보비대칭에 따른 정보 부족과 감독업무의 성과와 연계된 이익이
|
59 |
+
미미함에 따라 감독권자의 책무 이행을 감시할 유인이 부족하다. 이상의 환경 하에서 사적 이익(private interest)을 추구하는 감독권자는
|
60 |
+
규제 포획(regulatory capture)에 취약할 수 있다. 다시 말해 상기의 환경 하에서는 산업, 정치 등으로부터의 영향력 행사가 감독권자의
|
61 |
+
사익에 부합할 경우에 공익에서 벗어난 의사결정을 초래할 수 있다. 이상과 같이 왜곡된 유인체계로 인한 감독지배구조의 실패라는 문제를 해결하기
|
62 |
+
위해서는 감독권자의 유인체계를 조정하는 방안을 모색할 수 있을 것이다.
|
63 |
+
- '4. 개선과제
|
64 |
+
|
65 |
+
(1) 화장시설 운영의 개선과제
|
66 |
+
|
67 |
+
첫째, 지역주민들의 강력한 반대 속에 대규모 화장시설을 확충하는 방식을 지양하고, 환경 친화적인 소규모 추모공원의 형태로 화장시설을 늘려나가는
|
68 |
+
방식이 필요하다. 둘째, 현행 화장시설의 공공성을 고려하여 기타 사회복지시설에 포함시키고, 관련 비용의 감액이 가능하도록 입법화하는 방안도
|
69 |
+
모색할 필요성이 있다. 셋째, 장례업자로 하여금, 화장하는 시신의 경우는 유가족들에게 매장용이 아닌 화장 전용 관을 판매하도록 독려해야 할
|
70 |
+
것이다. (2) 봉안시설 운영의 개선과제
|
71 |
+
|
72 |
+
첫째, 봉안시설이 무분별하게 증가하지 못하도록 설치 및 운영을 현행 신고제에서 허가제로 변경하는 방안도 고려해 볼 수 있다. 이는 봉안시설의
|
73 |
+
환경훼손 문제를 해결하고 시설운영적자로 인한 빈번한 폐지 등을 방지하기 위해서 필요한 조치로 사료된다. 둘째, 봉안시설이 향후 관리되지 않고
|
74 |
+
방치되어 무연고 골분의 발생을 야기시킬 수 있는 만큼, 봉안시설을 사자(死者)에 대한 반영구적 추모시설로 활용할 방안 마련이 필요하다. (3)
|
75 |
+
자연장지 운영의 개선과제
|
76 |
+
|
77 |
+
첫째, 기존의 분묘 설치기간을 단축할 수 있도록 기준일을 기존 분묘 설치일로 변경하는 등의 제도개선을 통해 분묘의 개장을 독려하고 자연장지를
|
78 |
+
확대해 나가는 정책적 접근이 필요하다. 둘째, 자연장지의 조성에 있어서 걸림돌이 될 수 있는 규정들, 예컨대 기존의 묘지지역에는 다양한 유형의
|
79 |
+
묘지를 운영해 나갈 수 있도록 절차를 단순화하려는 노력이 필요하다. 이러한 개선과제들은 장사시설을 혐오하는 사고방식을 탈피하고, 진정한 추모의식과
|
80 |
+
문화를 계승해 나가려는 국민들의 적극적인 노력이 밑받침될 때 비로소 성공할 수 있을 것이다.'
|
81 |
+
- source_sentence: 중소기업의 수출을 정책적으로 지원하기 위해 어떻게 조사를 진행했어?
|
82 |
+
sentences:
|
83 |
+
- '4. 시사점
|
84 |
+
|
85 |
+
2000~2008년과 2009~2012년의 두 기간을 비교할 때, 중소ㆍ중견기업과 대기업의 수출 증가율 차이는 4.5%만큼 확대되었는데, 이는
|
86 |
+
대기업의 높은 수출 증가율에 기인하는 바가 크다. 한편 2009년 이후 대기업은 수출비중 및 수출 증가율이 증가한 것에 반하여 중소기업의 수출
|
87 |
+
비중과 매년 수출증가율은 감소했다. 2012년에 중소기업 수출증가율이 1.1%에 불과함을 고려하면 영세업체가 대다수인 중소기업의 수출 증대가
|
88 |
+
난관에 봉착해 있으며, 이의 돌파를 위한 다양한 정책적 지원이 필요함을 알 수 있다. 효율적인 정책적 지원을 위해 수출 중소기업의 애로 및
|
89 |
+
필요가 어떻게 변천되었는지 검토한 결과, 외환위기 시기인 1998년의 수출 중소기업들은 수출시작 단계인 업체와 수출 중인 업체 모두 자금지원의
|
90 |
+
필요성을 순위 높게 매겼으며 수출시작 시기인 중소기업들은 바이어찾기 등 수출 성사에 직접적으로 연관된 정보에 대한 필요가 컸다. 2012년
|
91 |
+
및 2014년의 수출 중소기업들은 자금 지원보다는 마케팅 지원 및 정보제공 확대를 공통적으로 최우선 순위로 요구하였다. 그러나 1998년에
|
92 |
+
자금 지원의 필요가 가장 두드러졌던 것은 외환위기라는 특수한 시기에 따른 일시적인 현상으로 볼 수 있다. 한편 해외바이어정보 및 무역 동향ㆍ해외시장정보
|
93 |
+
제공에 해당하는 ‘정보제공 및 판매인프라 구축’ 항목과 무역사절단 파견ㆍ해외전시회 참가ㆍ시장개척단 파견 등에 해당하는 ‘해외 마케팅’ 항목에
|
94 |
+
대한 중소기업의 필요는 항상 높은 순위를 기록하였다. 최근 이에 관한 필요성이 더욱 두드러지므로 관련 민ㆍ관 기관들의 원활한 업무연계가 더욱
|
95 |
+
요구된다. 특히 산업통상자원부는 바이어 정보 DB 및 국내 업체 DB를 보유한 코트라, 중소기업진흥공사, 무역협회 등 연관 기관들이 기관 각각의
|
96 |
+
이해관계를 넘어서서 수요자인 중소기업이 수출현장에서 높은 협상력을 보유하도록 장기적으로 DB를 공유ㆍ통합할 수 있는 효율적이고 합리적인 방안을
|
97 |
+
강구해야 할 것이다. 또한 해외 마케팅 관련 예산을 증액하고 신흥시장 수출 증가를 위하여 국격제고 및 한류와 CSR 이용 등 다양한 수출마케팅
|
98 |
+
전략 추진을 지속ㆍ확대할 필요가 있다.'
|
99 |
+
- '보험업법 시행령 및 감독규정 일부개정령(안) 입법예고
|
100 |
+
|
101 |
+
1. 개정이유
|
102 |
+
|
103 |
+
보험업법 규제입증정비위원회 등을 통해 정비 필요성이 입증된 기존 규제를 정비하는 한편 손해사정 제도 정비를 통해 보험소비자의 권익을 제고하기
|
104 |
+
위함 2. 주요 내용
|
105 |
+
|
106 |
+
가. 보험회사의 중요사항 설명의무 확대
|
107 |
+
|
108 |
+
보험회사가 상법에 따른 보험금청구권의 소멸시효, 손해사정사 선임에 관한 동의기준 등을 소비자에게 안내하도록 의무화
|
109 |
+
|
110 |
+
나. 보험회사의 선불전자지급업무 겸영 허용
|
111 |
+
|
112 |
+
보험회사가 헬스케어 서비스 운영을 위해 필요한 범위에서 선불전자지급업무를 겸영업무로 영위할 수 있도록 허용
|
113 |
+
|
114 |
+
다. 손해사정업자의 책임성 강화
|
115 |
+
|
116 |
+
손해사정 업무의 공정성·책임성 강화를 위해 손해사정협회가 표준 업무기준을 마련하여 손해사정업자에 권고토록 하고, 대형 손해사정업자(100인
|
117 |
+
이상)에 대해서는 금융위·원이 정하는 세부 업무기준·요건을 의무적으로 갖추도록 규정
|
118 |
+
|
119 |
+
라. 보험업 인허가 심사중단제도 개선
|
120 |
+
|
121 |
+
보험업 인허가 관련 심사지연을 방지하고 신청인의 예측가능성을 제고하기 위해 중대성·명백성 등 기본원칙에 따라 중단요건을 세분화·구체화하고,
|
122 |
+
매 6개월마다 심사재개여부를 검토하도록 규정'
|
123 |
+
- "하반기 수출 단기 지원 프로그램으로 , Cheer-up! □ 지식경제부는 7.25(수) 홍석우 장관 주재로 어려워지는 하반기 중소기업\
|
124 |
+
\ 수출여건에 선제적으로 대응하기 위해 ‘중소기업 수출 확대 지원회의 ’ 를 갖고 , 「중소기업 수출확대 단기지원방안 」 을 발표함 \nㅇ\
|
125 |
+
\ 회의에는 수출 중소기업과 KOTRA, K-Sure등 유관기관에서 참석하여 하반기 악화되는 대외 수출여건 대응방안에 대해 논의함\n□ 최근\
|
126 |
+
\ 대외여건 악화로 2012년 상반기 우리 무역은 수출입 증가율이 둔화되고 무역흑자가 2/3 수준으로 축소되는 등 불안한 모습\nㅇ 상반기에\
|
127 |
+
\ 이어 하반기에도 그리스, 스페인 등 EU 재정위기로부터의 불안요인이 지속되는 가운데, 수출 점유율이 높은 미국과 중국의 경기 회복 지연과\
|
128 |
+
\ 최대 수출품목인 선박 수출 부진이 우려되는 상황"
|
129 |
+
- source_sentence: 어떻게 입법부는 통일비용에 대한 정치사회학적인 접근을 도모할 수 있어?
|
130 |
+
sentences:
|
131 |
+
- '3. 정책적 측면
|
132 |
+
|
133 |
+
우선 통일비용에 대한 정치사회적 접근을 이루기 위해서는 국회가 통일정책과 대북정책의 상관성을 명확히 재정립하는 것이 필요하다. 역대 정부는
|
134 |
+
항상 통일정책이 대북정책과 밀접하게 연관되어 있다고 표방해왔다. 즉 평화통일이라는 헌법적 명령에 따라 포괄적인 범주를 가진 통일정책을 추진하며,
|
135 |
+
이틀 속에서 북한을 대상으로 한 대북정책이 입안·추진된다는 것이다. 이의 당위성은 의심의 여지가 없지만, 이제까지 실제로 추진된 정책도 과연
|
136 |
+
그러했었는지는 의문이다(김학성, 2012). 더욱이 통일 문제는 겉으로 보기에는 민족 문제이고 국제 문제이지만 DNA상으로는 정치 문제이기
|
137 |
+
때문에, 통일 문제는 신보수주의의 사상적 기원이 되고 있는 슈미트(Karl Schmidt)의 말(카를 슈미트, 2012)처럼, 국내적으로는
|
138 |
+
승자 독식의 정치판 세계에서 ‘적과 동지의 문제’가 되어 극과 극의 대결이 치닫게 되는 경우가 대부분이다(정세현, 2013).'
|
139 |
+
- '전통주 등의 산업진흥에 관한 법률 시행령 일부개정령안 입법예고
|
140 |
+
|
141 |
+
1. 개정이유
|
142 |
+
|
143 |
+
전통주 등 관련 단체의 자조금 적립 지원 등의 내용으로 전통주 등의 산업진흥에 관한 법률이 개정(법률 제16788호, 2019. 12. 10.
|
144 |
+
공포, 2020. 6. 11. 시행)됨에 따라, 자조금의 조성방법, 보조금의 지급기준 등 법률에서 위임된 사항과 그 시행을 위하여 필요한 사항을
|
145 |
+
정하려는 것��� 2. 주요내용
|
146 |
+
|
147 |
+
가. 자조금의 조성방법 및 용도(안 제4조의2)
|
148 |
+
|
149 |
+
1) (제·개정 주요내용) 자조금 조성 단체는 그 구성원이 자율적으로 납입하는 금액으로 자조금을 조성하고, 전통주 등의 홍보, 품질향상, 판로확대
|
150 |
+
등을 위해 사용하도록 정함 2) (제·개정 사유) 자조금 사업을 통해 전통주 등 생산업체의 경쟁력이 제고될 것으로 기대됨
|
151 |
+
|
152 |
+
나. 보조금 지급 기준(안 제4조의3)
|
153 |
+
|
154 |
+
1) (제·개정 주요내용) 보조금을 지급 받으려는 자조금 조성 단체의 요건, 보조금의 지급한도, 관련 자료제출 요청 권한 등을 정함 2) (제·개정
|
155 |
+
사유) 자조금의 효과적인 운영을 위해 보조금 지급기준을 정함'
|
156 |
+
- 여야는 통일비용에 대한 주요 쟁점 사안에 대해서는 사전에 협력을 모색해야 한다. 여권은 정부의 입장을 무조건 지지하기보다는 국민통합이라는 차원에서
|
157 |
+
심사숙고해야 하고, 야권은 정부의 입장을 그대로 수용하기 어렵다고 하더라도 반대를 위한 반대를 지양하고 대안을 제시해야 한다. 따라서 여야는
|
158 |
+
여야 간사 회의 등을 통해 통일비용에 대한 주요 사안에 대해서 사전 조율하는 노력이 필요하다. 통일비용에 대한 초당적인 협력이 구현되기 위해
|
159 |
+
국회차원의 제도적인 조정·협의 기구(분과위원회 개최 등)도 필요하다. 정치권은 다수 국민이 무엇을 생각하는지를 우선 고려해서 정책방향을 수립해야
|
160 |
+
한다. 초당적인 협력을 바탕으로 하는 통일정책은 정권이 교체된다고 하더라도 지속될 수 있다. 통일정책에 대한 정치권의 초당적인 협력을 바탕으로
|
161 |
+
통일정책에 대한 국민적 화합을 모색하는 것이 필요하다. 북한과의 군사적 대치 상황에서 안보는 그 무엇과 바꿀 수 없을 정도로 매우 중요한 사안이다.
|
162 |
+
그렇지만 안보 위주의 통일정책은 남북관계의 발전을 요구하는 다수 국민의 수요를 충족시키기에는 부족함이 없지 않다. 통일정책은 남북관계의 발전과
|
163 |
+
안보를 동시에 고려하면서 적절한 합일점을 찾아야 한다. 정부의 성향에 따라 통일정책이 강경과 온건을 선회하는 현상을 반복해서는 국민적 합의를
|
164 |
+
이끌어낼 수 없다.
|
165 |
+
- source_sentence: 경북 동해안지역 비은행의 2010년 기준 수신 증가율이 어떻게 돼?
|
166 |
+
sentences:
|
167 |
+
- □ 예금은행과 비은행금융기관 모두 금융위기의 영향으로 증가세가 일시 낮아졌으나 2008년 이후 증가세를 회복한 가운데 비은행금융기관의 증가세
|
168 |
+
확대가 현저<br>ㅇ 시장이자율 하락에 따른 상대적 고금리 매력 부각, 2009년중 비과세한도 상향 조정 등에 따라 비은행금융기관의 수신이
|
169 |
+
상대적으로 호조를 보인 점은 전국적인 현상이나 2010년 들어 전국의 예금은행 수신이 빠르게 증가하고 비은행금융기관 수신 증가세가 상당폭 둔화된
|
170 |
+
것과는 달리 경북동해안은 비은행 금융기관이 비교적 높은 증가세를 유지하고 예금은행 증가세는 상대적으로 완만<br>― 이는 2010년 들어 상호저축은행의
|
171 |
+
부실 우려가 확산되면서 자금이 예금은행으로 이동함에 따라 전국 비은행금융기관의 수신 증가세가 빠르게 위축된 반면 경북동해안은 주민들이 이미
|
172 |
+
2007년 경북상호저축은행 사태를 겪<br>은 데다 상호저축은행의 비중도 낮아 크게 동요되지 않았던 데 주로 기인<br>ㅇ 다만 2011년
|
173 |
+
들어 타 지역 부실저축은행 영업정지 사태, 지역내 일부 비은행금융기관의 횡령 사고 등으로 비은행금융기관에 대한 신뢰가 하락하면서 역내 비은행금융기관의
|
174 |
+
수신 증가세도 주춤
|
175 |
+
- '□ 경북동해안지역 예금은행의 가계대출 증가율은 전국 예금은행 뿐만 아니라 전국 비은행금융기관의 증가율도 상회하고 있음
|
176 |
+
|
177 |
+
ㅇ 전국 예금은행과 비은행금융기관의 경우 가계대출 증가세가 2013.4월과 5월에 들어서야 회복되었으나 경북동해안지역은 2009년말부터 동
|
178 |
+
대출 증가세가 꾸준히 확대되었음
|
179 |
+
|
180 |
+
ㅇ 지역내 예금은행의 가계대출 증가세는 2012년초부터 주택담보대출에 의해 견인되고 있는 모습임
|
181 |
+
|
182 |
+
― 경북동해안지역 예금은행의 가계대출액은 3조 3,832억원으로 주택담보대출액은 이중 54.5%인 1조 8,436억원임(2013.9월말 잔액기준)'
|
183 |
+
- '2. 일수벌금제와 책임주의
|
184 |
+
|
185 |
+
일수벌금제 도입을 반대하는 입장에서의 가장 근본적인 근거는 일수벌금제는 동일한 (불법)행위에 대하여 동일한 책임을 지는 것이 아니기 때문에
|
186 |
+
이것이 형법상 책임주의 원칙에 반한다는 것이다. 즉, 행위 책임에 있어서 행위자 책임 요소인 경제적 상황을 고려하는 것은 타당하지 않다는 것이다.
|
187 |
+
이러한 입장에서는 동일한 범죄에 대하여는 행위자의 상황과 관계없이 동일한 벌금형을 부과하는 것이 평등하다고 본다. 반면 일수벌금제 도입에 찬성하는
|
188 |
+
입장에서는 일수벌금형제도는 형벌에 있어서 동일한 형벌효과를 줄 수 있는 제재를 부과하는 것이 형벌상의 실질적 평등을 실현한다는 측면에서 책임주의에
|
189 |
+
반하지 않는다고 주장한다. 동일한 형벌효과(형벌효과의 형평성)를 주기 위해 행위 책임의 범위 안에서 행위자 책임을 고려하는 것은 책임주의에
|
190 |
+
반하지 않는다는 것이다.'
|
191 |
+
- source_sentence: 빅데이터 활용의 증가로 인해 개인정보를 보호하기 위한 조치로 도입하려고 하는 건 뭐야?
|
192 |
+
sentences:
|
193 |
+
- 후속 질문으로 ‘현충시설 대체 명칭 선호도’를 공통적으로 물었으며, 응답자 편의를 위하여 설문지 내에 현충시설의 정의를 제시하여 이해를 도왔다.
|
194 |
+
민주화운동 관련 기념시설 포함 여부와 유사하게 명칭 선호도에서도 일반인과 공무원의 시각 차이가 드러났다. 일반인은 ‘현충선양시설’(22%),
|
195 |
+
‘현충민주시설’(16.5%), ‘현충사적’(15.5%)을 순서대로 선택하였지만, 공무원은 ‘보훈선양시설’(36.1%), ‘현충시설’(27.9%),
|
196 |
+
‘현충선양시설’(16.4%) 순으로 선호도가 나타났다. 일반인 1∼3순위 모두에 ‘현충’이 들어가 기존 현충시설 명칭의 연장선으로 인지하는
|
197 |
+
듯 보였으나, 이와 달리 공무원은 ‘보훈’, ‘선양’ 등 부서별이나 정책에서 사용되는 명칭을 선호하는 것으로 드러났다(<표 7> 참고).
|
198 |
+
- 'Ⅰ. 서론
|
199 |
+
|
200 |
+
□ 최근 빅데이터(Big Data) 분석 등을 통해 다양한 사회적 유용성과 가치를 가지는 정보 산출(산업)에 관심이 높아지면서, 개인정보 보호규제가
|
201 |
+
장애요인으로 등장하고 있다는 평가로 인하여, 비식별화(de-identification) 또는 익명화(anonymization)를 통한 개인정보
|
202 |
+
활용의 필요성이 논의되고 있음 ○ 국내외 개인정보 보호법제들은 기본적으로 ‘개인 식별 가능성’을 판단 기준으로 하여 개인정보의 개념적 범위를
|
203 |
+
설정하여 이를 보호하는 체계를 가지고 있으며, 일반적으로 이러한 개인 식별 가능성을 제약 또는 제거하는 조치를 ‘비식별화’ 또는 ‘익명화’라고
|
204 |
+
표현함
|
205 |
+
|
206 |
+
○ 우리나라뿐만 아니라, EU, 미국, 일본 등 주요 국가들도 빅데이터 등의 산업적 분석 및 활용 과정에서 발생하고 있는 문제점에 착안하여
|
207 |
+
개인정보 보호 법제 개선에 관한 논의를 진지하게 진행하고 있음 □ 국내외적으로 개인정보 ‘비식별화’ 또는 ‘익명화’, 그리고 그 법적 효과와
|
208 |
+
관련해서는 아직까지 확고한 개념정의 등이 존재하지 않는 상황이라고 할 수 있어, 관련 개념의 법적 활용에 있어 상당한 논란이 제기되고 있음
|
209 |
+
○ ‘비식별화’는 특정 정보로부터 ‘개인 식별 가능성’을 제거하는 조치 및 과정을 의미하며, 종종 이러한 용어는 ‘익명화’와 동일한 의미로
|
210 |
+
사용됨
|
211 |
+
|
212 |
+
- 비식별화라는 용어는 미국 등의 국가에서 주로 활용되고 있으며, 익명화 또는 익명가공이라는 용어는 EU 및 일본 등지에서 활용되고 있는 것으로
|
213 |
+
파악되지만, 대체적으로 두 용어가 혼용되고 있는 양상임'
|
214 |
+
- □ 지난 2014년 1월 발생한 카드회사의 개인정보 유출사고 이후 개인정보의 보호 강화 및 정보유출 재발방지를 위한 제도개선 방안이 논의되어
|
215 |
+
「금융분야 개인정보 유출 재발방지 종합대책」이 마련되기도 하였음 ○ 이와 함께 2015년 7월 「개인정보보호법」이 개정되어 징벌적손해배상제도가
|
216 |
+
도입되고, 불법적인 개인정보 유통 등에 대한 제재수준이 강화되었음 □ 하지만 지난 카드사태의 개인정보 유출 사례와 같이 한번 유출된 정보는
|
217 |
+
회수가 불가능하고 사후적인 제재를 강화하는 것만으로는 금융소비자의 피해를 방지하는데 한계가 있을 수밖에 없음 ○ 이에 따라 정보의 수집, 제공,
|
218 |
+
유통, 관리 전반에서 있어서 금융회사의 개인정보에 대한 기술적‧관리적 보호체계의 실질적인 강화를 통한 금융사고 예방이 보다 중요하다고 할 수
|
219 |
+
있음 □ 한편 우리나라는 해외와 비교해보면 빅데이터 활용이 초기단계에 해당하지만, 인터넷전문은행 도입과 관련하여 빅데이터 활용에 대한 금융회사의
|
220 |
+
관심이 증가하고 있음 ○ 현재 빅데이터를 활성화하기 위해 「신용정보의 이용 및 보호에 관한 법률」 개정을 통해 개인신용정보의 개념을 보다 명확하게
|
221 |
+
정의하여 금융회사가 활용할 수 있는 비식별정보를 구분하는 방안이 추진되고 있음 □ 하지만 개인신용정보 중에서 식별화정보와 비식별화 정보를 명확히
|
222 |
+
구분하는 것이 현실적으로 쉽지 않으므로 빅데이터의 활성화를 위해 개인정보의 균형있는 보호와 활용이 필요한 시점임 ○ 특히 개인신용정보에서 개인을
|
223 |
+
식별할 수 없는 비식별정보를 구분하는 경우에도 동 정보의 이용 목적을 제한하고, 비식별정보의 재식별 방지를 위한 안전성 확보 방안 등을 마련할
|
224 |
+
필요가 있음
|
225 |
+
pipeline_tag: sentence-similarity
|
226 |
+
library_name: sentence-transformers
|
227 |
+
---
|
228 |
+
|
229 |
+
# SentenceTransformer based on BAAI/bge-m3
|
230 |
+
|
231 |
+
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
|
232 |
+
|
233 |
+
## Model Details
|
234 |
+
|
235 |
+
### Model Description
|
236 |
+
- **Model Type:** Sentence Transformer
|
237 |
+
- **Base model:** [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3) <!-- at revision 5617a9f61b028005a4858fdac845db406aefb181 -->
|
238 |
+
- **Maximum Sequence Length:** 1024 tokens
|
239 |
+
- **Output Dimensionality:** 1024 tokens
|
240 |
+
- **Similarity Function:** Cosine Similarity
|
241 |
+
<!-- - **Training Dataset:** Unknown -->
|
242 |
+
<!-- - **Language:** Unknown -->
|
243 |
+
<!-- - **License:** Unknown -->
|
244 |
+
|
245 |
+
### Model Sources
|
246 |
+
|
247 |
+
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
|
248 |
+
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
|
249 |
+
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
|
250 |
+
|
251 |
+
### Full Model Architecture
|
252 |
+
|
253 |
+
```
|
254 |
+
SentenceTransformer(
|
255 |
+
(0): Transformer({'max_seq_length': 1024, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
|
256 |
+
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
|
257 |
+
(2): Normalize()
|
258 |
+
)
|
259 |
+
```
|
260 |
+
|
261 |
+
## Usage
|
262 |
+
|
263 |
+
### Direct Usage (Sentence Transformers)
|
264 |
+
|
265 |
+
First install the Sentence Transformers library:
|
266 |
+
|
267 |
+
```bash
|
268 |
+
pip install -U sentence-transformers
|
269 |
+
```
|
270 |
+
|
271 |
+
Then you can load this model and run inference.
|
272 |
+
```python
|
273 |
+
from sentence_transformers import SentenceTransformer
|
274 |
+
|
275 |
+
# Download from the 🤗 Hub
|
276 |
+
model = SentenceTransformer("seongil-dn/bge-m3-kor-retrieval-451949-bs64-finance-50")
|
277 |
+
# Run inference
|
278 |
+
sentences = [
|
279 |
+
'빅데이터 활용의 증가로 인해 개인정보를 보호하기 위한 조치로 도입하려고 하는 건 뭐야?',
|
280 |
+
'Ⅰ. 서론\n□ 최근 빅데이터(Big Data) 분석 등을 통해 다양한 사회적 유용성과 가치를 가지는 정보 산출(산업)에 관심이 높아지면서, 개인정보 보호규제가 장애요인으로 등장하고 있다는 평가로 인하여, 비식별화(de-identification) 또는 익명화(anonymization)를 통한 개인정보 활용의 필요성이 논의되고 있음 ○ 국내외 개인정보 보호법제들은 기본적으로 ‘개인 식별 가능성’을 판단 기준으로 하여 개인정보의 개념적 범위를 설정하여 이를 보호하는 체계를 가지고 있으며, 일반적으로 이러한 개인 식별 가능성을 제약 또는 제거하는 조치를 ‘비식별화’ 또는 ‘익명화’라고 표현함\n○ 우리나라뿐만 아니라, EU, 미국, 일본 등 주요 국가들도 빅데이터 등의 산업적 분석 및 활용 과정에서 발생하고 있는 문제점에 착안하여 개인정보 보호 법제 개선에 관한 논의를 진지하게 진행하고 있음 □ 국내외적으로 개인정보 ‘비식별화’ 또는 ‘익명화’, 그리고 그 법적 효과와 관련해서는 아직까지 확고한 개념정의 등이 존재하지 않는 상황이라고 할 수 있어, 관련 개념의 법적 활용에 있어 상당한 논란이 제기되고 있음 ○ ‘비식별화’는 특정 정보로부터 ‘개인 식별 가능성’을 제거하는 조치 및 과정을 의미하며, 종종 이러한 용어는 ‘익명화’와 동일한 의미로 사용됨\n- 비식별화라는 용어는 미국 등의 국가에서 주로 활용되고 있으며, 익명화 또는 익명가공이라는 용어는 EU 및 일본 등지에서 활용되고 있는 것으로 파악되지만, 대체적으로 두 용어가 혼용되고 있는 양상임',
|
281 |
+
'□ 지난 2014년 1월 발생한 카드회사의 개인정보 유출사고 이후 개인정보의 보호 강화 및 정보유출 재발방지를 위한 제도개선 방안이 논의되어 「금융분야 개인정보 유출 재발방지 종합대책」이 마련되기도 하���음 ○ 이와 함께 2015년 7월 「개인정보보호법」이 개정되어 징벌적손해배상제도가 도입되고, 불법적인 개인정보 유통 등에 대한 제재수준이 강화되었음 □ 하지만 지난 카드사태의 개인정보 유출 사례와 같이 한번 유출된 정보는 회수가 불가능하고 사후적인 제재를 강화하는 것만으로는 금융소비자의 피해를 방지하는데 한계가 있을 수밖에 없음 ○ 이에 따라 정보의 수집, 제공, 유통, 관리 전반에서 있어서 금융회사의 개인정보에 대한 기술적‧관리적 보호체계의 실질적인 강화를 통한 금융사고 예방이 보다 중요하다고 할 수 있음 □ 한편 우리나라는 해외와 비교해보면 빅데이터 활용이 초기단계에 해당하지만, 인터넷전문은행 도입과 관련하여 빅데이터 활용에 대한 금융회사의 관심이 증가하고 있음 ○ 현재 빅데이터를 활성화하기 위해 「신용정보의 이용 및 보호에 관한 법률」 개정을 통해 개인신용정보의 개념을 보다 명확하게 정의하여 금융회사가 활용할 수 있는 비식별정보를 구분하는 방안이 추진되고 있음 □ 하지만 개인신용정보 중에서 식별화정보와 비식별화 정보를 명확히 구분하는 것이 현실적으로 쉽지 않으므로 빅데이터의 활성화를 위해 개인정보의 균형있는 보호와 활용이 필요한 시점임 ○ 특히 개인신용정보에서 개인을 식별할 수 없는 비식별정보를 구분하는 경우에도 동 정보의 이용 목적을 제한하고, 비식별정보의 재식별 방지를 위한 안전성 확보 방안 등을 마련할 필요가 있음',
|
282 |
+
]
|
283 |
+
embeddings = model.encode(sentences)
|
284 |
+
print(embeddings.shape)
|
285 |
+
# [3, 1024]
|
286 |
+
|
287 |
+
# Get the similarity scores for the embeddings
|
288 |
+
similarities = model.similarity(embeddings, embeddings)
|
289 |
+
print(similarities.shape)
|
290 |
+
# [3, 3]
|
291 |
+
```
|
292 |
+
|
293 |
+
<!--
|
294 |
+
### Direct Usage (Transformers)
|
295 |
+
|
296 |
+
<details><summary>Click to see the direct usage in Transformers</summary>
|
297 |
+
|
298 |
+
</details>
|
299 |
+
-->
|
300 |
+
|
301 |
+
<!--
|
302 |
+
### Downstream Usage (Sentence Transformers)
|
303 |
+
|
304 |
+
You can finetune this model on your own dataset.
|
305 |
+
|
306 |
+
<details><summary>Click to expand</summary>
|
307 |
+
|
308 |
+
</details>
|
309 |
+
-->
|
310 |
+
|
311 |
+
<!--
|
312 |
+
### Out-of-Scope Use
|
313 |
+
|
314 |
+
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
|
315 |
+
-->
|
316 |
+
|
317 |
+
<!--
|
318 |
+
## Bias, Risks and Limitations
|
319 |
+
|
320 |
+
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
|
321 |
+
-->
|
322 |
+
|
323 |
+
<!--
|
324 |
+
### Recommendations
|
325 |
+
|
326 |
+
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
|
327 |
+
-->
|
328 |
+
|
329 |
+
## Training Details
|
330 |
+
|
331 |
+
### Training Hyperparameters
|
332 |
+
#### Non-Default Hyperparameters
|
333 |
+
|
334 |
+
- `per_device_train_batch_size`: 64
|
335 |
+
- `learning_rate`: 3e-05
|
336 |
+
- `num_train_epochs`: 1
|
337 |
+
- `max_steps`: 50
|
338 |
+
- `warmup_ratio`: 0.05
|
339 |
+
- `fp16`: True
|
340 |
+
- `batch_sampler`: no_duplicates
|
341 |
+
|
342 |
+
#### All Hyperparameters
|
343 |
+
<details><summary>Click to expand</summary>
|
344 |
+
|
345 |
+
- `overwrite_output_dir`: False
|
346 |
+
- `do_predict`: False
|
347 |
+
- `eval_strategy`: no
|
348 |
+
- `prediction_loss_only`: True
|
349 |
+
- `per_device_train_batch_size`: 64
|
350 |
+
- `per_device_eval_batch_size`: 8
|
351 |
+
- `per_gpu_train_batch_size`: None
|
352 |
+
- `per_gpu_eval_batch_size`: None
|
353 |
+
- `gradient_accumulation_steps`: 1
|
354 |
+
- `eval_accumulation_steps`: None
|
355 |
+
- `torch_empty_cache_steps`: None
|
356 |
+
- `learning_rate`: 3e-05
|
357 |
+
- `weight_decay`: 0.0
|
358 |
+
- `adam_beta1`: 0.9
|
359 |
+
- `adam_beta2`: 0.999
|
360 |
+
- `adam_epsilon`: 1e-08
|
361 |
+
- `max_grad_norm`: 1.0
|
362 |
+
- `num_train_epochs`: 1
|
363 |
+
- `max_steps`: 50
|
364 |
+
- `lr_scheduler_type`: linear
|
365 |
+
- `lr_scheduler_kwargs`: {}
|
366 |
+
- `warmup_ratio`: 0.05
|
367 |
+
- `warmup_steps`: 0
|
368 |
+
- `log_level`: passive
|
369 |
+
- `log_level_replica`: warning
|
370 |
+
- `log_on_each_node`: True
|
371 |
+
- `logging_nan_inf_filter`: True
|
372 |
+
- `save_safetensors`: True
|
373 |
+
- `save_on_each_node`: False
|
374 |
+
- `save_only_model`: False
|
375 |
+
- `restore_callback_states_from_checkpoint`: False
|
376 |
+
- `no_cuda`: False
|
377 |
+
- `use_cpu`: False
|
378 |
+
- `use_mps_device`: False
|
379 |
+
- `seed`: 42
|
380 |
+
- `data_seed`: None
|
381 |
+
- `jit_mode_eval`: False
|
382 |
+
- `use_ipex`: False
|
383 |
+
- `bf16`: False
|
384 |
+
- `fp16`: True
|
385 |
+
- `fp16_opt_level`: O1
|
386 |
+
- `half_precision_backend`: auto
|
387 |
+
- `bf16_full_eval`: False
|
388 |
+
- `fp16_full_eval`: False
|
389 |
+
- `tf32`: None
|
390 |
+
- `local_rank`: 0
|
391 |
+
- `ddp_backend`: None
|
392 |
+
- `tpu_num_cores`: None
|
393 |
+
- `tpu_metrics_debug`: False
|
394 |
+
- `debug`: []
|
395 |
+
- `dataloader_drop_last`: True
|
396 |
+
- `dataloader_num_workers`: 0
|
397 |
+
- `dataloader_prefetch_factor`: None
|
398 |
+
- `past_index`: -1
|
399 |
+
- `disable_tqdm`: False
|
400 |
+
- `remove_unused_columns`: True
|
401 |
+
- `label_names`: None
|
402 |
+
- `load_best_model_at_end`: False
|
403 |
+
- `ignore_data_skip`: False
|
404 |
+
- `fsdp`: []
|
405 |
+
- `fsdp_min_num_params`: 0
|
406 |
+
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
|
407 |
+
- `fsdp_transformer_layer_cls_to_wrap`: None
|
408 |
+
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
|
409 |
+
- `deepspeed`: None
|
410 |
+
- `label_smoothing_factor`: 0.0
|
411 |
+
- `optim`: adamw_torch
|
412 |
+
- `optim_args`: None
|
413 |
+
- `adafactor`: False
|
414 |
+
- `group_by_length`: False
|
415 |
+
- `length_column_name`: length
|
416 |
+
- `ddp_find_unused_parameters`: None
|
417 |
+
- `ddp_bucket_cap_mb`: None
|
418 |
+
- `ddp_broadcast_buffers`: False
|
419 |
+
- `dataloader_pin_memory`: True
|
420 |
+
- `dataloader_persistent_workers`: False
|
421 |
+
- `skip_memory_metrics`: True
|
422 |
+
- `use_legacy_prediction_loop`: False
|
423 |
+
- `push_to_hub`: False
|
424 |
+
- `resume_from_checkpoint`: None
|
425 |
+
- `hub_model_id`: None
|
426 |
+
- `hub_strategy`: every_save
|
427 |
+
- `hub_private_repo`: False
|
428 |
+
- `hub_always_push`: False
|
429 |
+
- `gradient_checkpointing`: False
|
430 |
+
- `gradient_checkpointing_kwargs`: None
|
431 |
+
- `include_inputs_for_metrics`: False
|
432 |
+
- `eval_do_concat_batches`: True
|
433 |
+
- `fp16_backend`: auto
|
434 |
+
- `push_to_hub_model_id`: None
|
435 |
+
- `push_to_hub_organization`: None
|
436 |
+
- `mp_parameters`:
|
437 |
+
- `auto_find_batch_size`: False
|
438 |
+
- `full_determinism`: False
|
439 |
+
- `torchdynamo`: None
|
440 |
+
- `ray_scope`: last
|
441 |
+
- `ddp_timeout`: 1800
|
442 |
+
- `torch_compile`: False
|
443 |
+
- `torch_compile_backend`: None
|
444 |
+
- `torch_compile_mode`: None
|
445 |
+
- `dispatch_batches`: None
|
446 |
+
- `split_batches`: None
|
447 |
+
- `include_tokens_per_second`: False
|
448 |
+
- `include_num_input_tokens_seen`: False
|
449 |
+
- `neftune_noise_alpha`: None
|
450 |
+
- `optim_target_modules`: None
|
451 |
+
- `batch_eval_metrics`: False
|
452 |
+
- `eval_on_start`: False
|
453 |
+
- `eval_use_gather_object`: False
|
454 |
+
- `batch_sampler`: no_duplicates
|
455 |
+
- `multi_dataset_batch_sampler`: proportional
|
456 |
+
|
457 |
+
</details>
|
458 |
+
|
459 |
+
### Training Logs
|
460 |
+
| Epoch | Step | Training Loss |
|
461 |
+
|:-----:|:----:|:-------------:|
|
462 |
+
| 0.004 | 1 | 1.1692 |
|
463 |
+
| 0.008 | 2 | 1.0241 |
|
464 |
+
| 0.012 | 3 | 1.1237 |
|
465 |
+
| 0.016 | 4 | 0.9547 |
|
466 |
+
| 0.02 | 5 | 1.0183 |
|
467 |
+
| 0.024 | 6 | 0.9393 |
|
468 |
+
| 0.028 | 7 | 0.6666 |
|
469 |
+
| 0.032 | 8 | 0.7058 |
|
470 |
+
| 0.036 | 9 | 0.6336 |
|
471 |
+
| 0.04 | 10 | 0.5752 |
|
472 |
+
| 0.044 | 11 | 0.6901 |
|
473 |
+
| 0.048 | 12 | 0.6699 |
|
474 |
+
| 0.052 | 13 | 0.6184 |
|
475 |
+
| 0.056 | 14 | 0.5948 |
|
476 |
+
| 0.06 | 15 | 0.6546 |
|
477 |
+
| 0.064 | 16 | 0.5846 |
|
478 |
+
| 0.068 | 17 | 0.5892 |
|
479 |
+
| 0.072 | 18 | 0.5819 |
|
480 |
+
| 0.076 | 19 | 0.5602 |
|
481 |
+
| 0.08 | 20 | 0.5515 |
|
482 |
+
| 0.084 | 21 | 0.5359 |
|
483 |
+
| 0.088 | 22 | 0.5599 |
|
484 |
+
| 0.092 | 23 | 0.5104 |
|
485 |
+
| 0.096 | 24 | 0.4943 |
|
486 |
+
| 0.1 | 25 | 0.564 |
|
487 |
+
| 0.104 | 26 | 0.5545 |
|
488 |
+
| 0.108 | 27 | 0.4937 |
|
489 |
+
| 0.112 | 28 | 0.5283 |
|
490 |
+
| 0.116 | 29 | 0.512 |
|
491 |
+
| 0.12 | 30 | 0.552 |
|
492 |
+
| 0.124 | 31 | 0.5417 |
|
493 |
+
| 0.128 | 32 | 0.4607 |
|
494 |
+
| 0.132 | 33 | 0.4281 |
|
495 |
+
| 0.136 | 34 | 0.4764 |
|
496 |
+
| 0.14 | 35 | 0.5736 |
|
497 |
+
| 0.144 | 36 | 0.5312 |
|
498 |
+
| 0.148 | 37 | 0.4723 |
|
499 |
+
| 0.152 | 38 | 0.5169 |
|
500 |
+
| 0.156 | 39 | 0.4849 |
|
501 |
+
| 0.16 | 40 | 0.5347 |
|
502 |
+
| 0.164 | 41 | 0.48 |
|
503 |
+
| 0.168 | 42 | 0.4745 |
|
504 |
+
| 0.172 | 43 | 0.5061 |
|
505 |
+
| 0.176 | 44 | 0.5438 |
|
506 |
+
| 0.18 | 45 | 0.4942 |
|
507 |
+
| 0.184 | 46 | 0.5486 |
|
508 |
+
| 0.188 | 47 | 0.475 |
|
509 |
+
| 0.192 | 48 | 0.5054 |
|
510 |
+
| 0.196 | 49 | 0.3898 |
|
511 |
+
| 0.2 | 50 | 0.4726 |
|
512 |
+
|
513 |
+
|
514 |
+
### Framework Versions
|
515 |
+
- Python: 3.10.12
|
516 |
+
- Sentence Transformers: 3.2.1
|
517 |
+
- Transformers: 4.44.2
|
518 |
+
- PyTorch: 2.3.1+cu121
|
519 |
+
- Accelerate: 1.1.1
|
520 |
+
- Datasets: 2.21.0
|
521 |
+
- Tokenizers: 0.19.1
|
522 |
+
|
523 |
+
## Citation
|
524 |
+
|
525 |
+
### BibTeX
|
526 |
+
|
527 |
+
#### Sentence Transformers
|
528 |
+
```bibtex
|
529 |
+
@inproceedings{reimers-2019-sentence-bert,
|
530 |
+
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
|
531 |
+
author = "Reimers, Nils and Gurevych, Iryna",
|
532 |
+
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
|
533 |
+
month = "11",
|
534 |
+
year = "2019",
|
535 |
+
publisher = "Association for Computational Linguistics",
|
536 |
+
url = "https://arxiv.org/abs/1908.10084",
|
537 |
+
}
|
538 |
+
```
|
539 |
+
|
540 |
+
#### CachedMultipleNegativesRankingLoss
|
541 |
+
```bibtex
|
542 |
+
@misc{gao2021scaling,
|
543 |
+
title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
|
544 |
+
author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
|
545 |
+
year={2021},
|
546 |
+
eprint={2101.06983},
|
547 |
+
archivePrefix={arXiv},
|
548 |
+
primaryClass={cs.LG}
|
549 |
+
}
|
550 |
+
```
|
551 |
+
|
552 |
+
<!--
|
553 |
+
## Glossary
|
554 |
+
|
555 |
+
*Clearly define terms in order to be accessible across audiences.*
|
556 |
+
-->
|
557 |
+
|
558 |
+
<!--
|
559 |
+
## Model Card Authors
|
560 |
+
|
561 |
+
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
|
562 |
+
-->
|
563 |
+
|
564 |
+
<!--
|
565 |
+
## Model Card Contact
|
566 |
+
|
567 |
+
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
|
568 |
+
-->
|
config.json
ADDED
@@ -0,0 +1,28 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"_name_or_path": "bge-m3-kor-retrieval-451949-bs64-finance/checkpoint-50",
|
3 |
+
"architectures": [
|
4 |
+
"XLMRobertaModel"
|
5 |
+
],
|
6 |
+
"attention_probs_dropout_prob": 0.1,
|
7 |
+
"bos_token_id": 0,
|
8 |
+
"classifier_dropout": null,
|
9 |
+
"eos_token_id": 2,
|
10 |
+
"hidden_act": "gelu",
|
11 |
+
"hidden_dropout_prob": 0.1,
|
12 |
+
"hidden_size": 1024,
|
13 |
+
"initializer_range": 0.02,
|
14 |
+
"intermediate_size": 4096,
|
15 |
+
"layer_norm_eps": 1e-05,
|
16 |
+
"max_position_embeddings": 8194,
|
17 |
+
"model_type": "xlm-roberta",
|
18 |
+
"num_attention_heads": 16,
|
19 |
+
"num_hidden_layers": 24,
|
20 |
+
"output_past": true,
|
21 |
+
"pad_token_id": 1,
|
22 |
+
"position_embedding_type": "absolute",
|
23 |
+
"torch_dtype": "float32",
|
24 |
+
"transformers_version": "4.44.2",
|
25 |
+
"type_vocab_size": 1,
|
26 |
+
"use_cache": true,
|
27 |
+
"vocab_size": 250002
|
28 |
+
}
|
config_sentence_transformers.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"__version__": {
|
3 |
+
"sentence_transformers": "3.2.1",
|
4 |
+
"transformers": "4.44.2",
|
5 |
+
"pytorch": "2.3.1+cu121"
|
6 |
+
},
|
7 |
+
"prompts": {},
|
8 |
+
"default_prompt_name": null,
|
9 |
+
"similarity_fn_name": null
|
10 |
+
}
|
model.safetensors
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:2bd1c5c0935c02190735a0a226a9dcac29edb2efc2e2fc3fe40a297700f219f2
|
3 |
+
size 2271064456
|
modules.json
ADDED
@@ -0,0 +1,20 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
[
|
2 |
+
{
|
3 |
+
"idx": 0,
|
4 |
+
"name": "0",
|
5 |
+
"path": "",
|
6 |
+
"type": "sentence_transformers.models.Transformer"
|
7 |
+
},
|
8 |
+
{
|
9 |
+
"idx": 1,
|
10 |
+
"name": "1",
|
11 |
+
"path": "1_Pooling",
|
12 |
+
"type": "sentence_transformers.models.Pooling"
|
13 |
+
},
|
14 |
+
{
|
15 |
+
"idx": 2,
|
16 |
+
"name": "2",
|
17 |
+
"path": "2_Normalize",
|
18 |
+
"type": "sentence_transformers.models.Normalize"
|
19 |
+
}
|
20 |
+
]
|
sentence_bert_config.json
ADDED
@@ -0,0 +1,4 @@
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"max_seq_length": 1024,
|
3 |
+
"do_lower_case": false
|
4 |
+
}
|
special_tokens_map.json
ADDED
@@ -0,0 +1,51 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"bos_token": {
|
3 |
+
"content": "<s>",
|
4 |
+
"lstrip": false,
|
5 |
+
"normalized": false,
|
6 |
+
"rstrip": false,
|
7 |
+
"single_word": false
|
8 |
+
},
|
9 |
+
"cls_token": {
|
10 |
+
"content": "<s>",
|
11 |
+
"lstrip": false,
|
12 |
+
"normalized": false,
|
13 |
+
"rstrip": false,
|
14 |
+
"single_word": false
|
15 |
+
},
|
16 |
+
"eos_token": {
|
17 |
+
"content": "</s>",
|
18 |
+
"lstrip": false,
|
19 |
+
"normalized": false,
|
20 |
+
"rstrip": false,
|
21 |
+
"single_word": false
|
22 |
+
},
|
23 |
+
"mask_token": {
|
24 |
+
"content": "<mask>",
|
25 |
+
"lstrip": true,
|
26 |
+
"normalized": false,
|
27 |
+
"rstrip": false,
|
28 |
+
"single_word": false
|
29 |
+
},
|
30 |
+
"pad_token": {
|
31 |
+
"content": "<pad>",
|
32 |
+
"lstrip": false,
|
33 |
+
"normalized": false,
|
34 |
+
"rstrip": false,
|
35 |
+
"single_word": false
|
36 |
+
},
|
37 |
+
"sep_token": {
|
38 |
+
"content": "</s>",
|
39 |
+
"lstrip": false,
|
40 |
+
"normalized": false,
|
41 |
+
"rstrip": false,
|
42 |
+
"single_word": false
|
43 |
+
},
|
44 |
+
"unk_token": {
|
45 |
+
"content": "<unk>",
|
46 |
+
"lstrip": false,
|
47 |
+
"normalized": false,
|
48 |
+
"rstrip": false,
|
49 |
+
"single_word": false
|
50 |
+
}
|
51 |
+
}
|
tokenizer.json
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:6e3b8957de04e3a4ed42b1a11381556f9adad8d0d502b9dd071c75f626b28f40
|
3 |
+
size 17083053
|
tokenizer_config.json
ADDED
@@ -0,0 +1,62 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"added_tokens_decoder": {
|
3 |
+
"0": {
|
4 |
+
"content": "<s>",
|
5 |
+
"lstrip": false,
|
6 |
+
"normalized": false,
|
7 |
+
"rstrip": false,
|
8 |
+
"single_word": false,
|
9 |
+
"special": true
|
10 |
+
},
|
11 |
+
"1": {
|
12 |
+
"content": "<pad>",
|
13 |
+
"lstrip": false,
|
14 |
+
"normalized": false,
|
15 |
+
"rstrip": false,
|
16 |
+
"single_word": false,
|
17 |
+
"special": true
|
18 |
+
},
|
19 |
+
"2": {
|
20 |
+
"content": "</s>",
|
21 |
+
"lstrip": false,
|
22 |
+
"normalized": false,
|
23 |
+
"rstrip": false,
|
24 |
+
"single_word": false,
|
25 |
+
"special": true
|
26 |
+
},
|
27 |
+
"3": {
|
28 |
+
"content": "<unk>",
|
29 |
+
"lstrip": false,
|
30 |
+
"normalized": false,
|
31 |
+
"rstrip": false,
|
32 |
+
"single_word": false,
|
33 |
+
"special": true
|
34 |
+
},
|
35 |
+
"250001": {
|
36 |
+
"content": "<mask>",
|
37 |
+
"lstrip": true,
|
38 |
+
"normalized": false,
|
39 |
+
"rstrip": false,
|
40 |
+
"single_word": false,
|
41 |
+
"special": true
|
42 |
+
}
|
43 |
+
},
|
44 |
+
"bos_token": "<s>",
|
45 |
+
"clean_up_tokenization_spaces": true,
|
46 |
+
"cls_token": "<s>",
|
47 |
+
"eos_token": "</s>",
|
48 |
+
"mask_token": "<mask>",
|
49 |
+
"max_length": 1024,
|
50 |
+
"model_max_length": 1024,
|
51 |
+
"pad_to_multiple_of": null,
|
52 |
+
"pad_token": "<pad>",
|
53 |
+
"pad_token_type_id": 0,
|
54 |
+
"padding_side": "right",
|
55 |
+
"sep_token": "</s>",
|
56 |
+
"sp_model_kwargs": {},
|
57 |
+
"stride": 0,
|
58 |
+
"tokenizer_class": "XLMRobertaTokenizer",
|
59 |
+
"truncation_side": "right",
|
60 |
+
"truncation_strategy": "longest_first",
|
61 |
+
"unk_token": "<unk>"
|
62 |
+
}
|