| | |
| | | private static final Set<String> STOP_WORDS = new HashSet<>(Arrays.asList( |
| | | "医院", "诊所", "卫生", "镇", "乡", |
| | | "街道", "路", "号", "栋", "单元", "室", "层", "楼", "的", "了", |
| | | "在", "与", "和", "及", "等", "之", "于", "为", "有", "无" |
| | | "在", "与", "和", "及", "等", "之", "于", "为", "有", "无","(",")","(",")","、",",","。","!","?",";",":","“","”","‘","’" |
| | | )); |
| | | |
| | | /** |
| | |
| | | private static final Set<String> HIGH_WEIGHT_WORDS = new HashSet<>(Arrays.asList( |
| | | "人民", "中医", "中西医", "中西医结合", "医疗", "妇幼", "儿童", "肤科", |
| | | "口腔", "眼科", "骨科", "整形", "精神", "康复", "急救", "医学院", |
| | | "医科大学", "专科", "第一", "第二", "第三", "第四", "第五", |
| | | "军区", "军医", "中心", "附属", "省立", "市立", "区立" |
| | | "医科大学", "专科", |
| | | "军区", "军医", "中心", "附属", "省立", "市立", "区立", "脑科", "总院", "慈善", "保健院", "口腔", "祈福", "眼科", "铁路", "附一", "附二", "附三", "附四", "附五", "附六", |
| | | "第一", "第二", "第三", "第四", "第五", "第六", "第七", "第八", "第九", "第十", |
| | | "肿瘤" |
| | | )); |
| | | |
| | | /** |
| | |
| | | private static final Set<String> HOSPITAL_KEYWORD_DICT = new HashSet<>(Arrays.asList( |
| | | "中医院", "中医医院", "市医院", "省医院", "人民医院", "中心医院", "口腔医院", |
| | | "华侨医院", "儿童医院", "眼科中心", "福利院", "门诊部", "中山大学", "附属医院", |
| | | "孙逸仙" |
| | | "孙逸仙","门诊" |
| | | )); |
| | | |
| | | /** 组合词生成的最小字符长度 */ |
| | |
| | | |
| | | // 分院特征关键词 |
| | | String[] branchKeywords = { |
| | | "分院", "分部", "门诊部", "社区卫生", "卫生站", "卫生服务中心", |
| | | "东院", "西院", "南院", "北院", "新院", "老院" |
| | | "分院", "分部", "门诊部","门诊", "社区卫生", "卫生站", "卫生服务中心", |
| | | "东院", "西院", "南院", "北院", "新院", "老院", |
| | | "人民医院","附属医院","福利院","分院" |
| | | |
| | | |
| | | }; |
| | | |
| | | for (String keyword : branchKeywords) { |