diff --git a/hospital-affiliations/aff_hosp.py b/hospital-affiliations/aff_hosp.py index 6fbb8ac..695089e 100755 --- a/hospital-affiliations/aff_hosp.py +++ b/hospital-affiliations/aff_hosp.py @@ -35,11 +35,8 @@ text_with_no_accent = re.sub("[\u0300-\u036f]", '', normalized_text) return text_with_no_accent -# On repère/marque les lignes dont l'affiliation contient la ville -def aff_ville(ville,texte): - if ville.lower() in texte.lower() : - return True - return False +def is_city_in_affiliation(city,affiliation): + return city.lower() in affiliation.lower() def fuzzywuzzy(affiliation,text = None): return fuzz.ratio(affiliation,text) @@ -61,7 +58,7 @@ df['Ville_canonique_Dpt'] = df['Ville_canonique_Dpt'].apply(remove_accents) if len(df[df['Terme Affiliation'] == True]) != 0: df2 = df[df['Terme Affiliation'] == True] - df2["Ville_présente"] = df2['Ville_canonique_Dpt'].apply(aff_ville,texte=texte) + df2["Ville_présente"] = df2['Ville_canonique_Dpt'].apply(is_city_in_affiliation,affiliation=texte) if len(df2[df2["Ville_présente"] == True]) != 0: df3 = df2[df2["Ville_présente"] == True] df3["ratio"] = df3["Affiliation"].apply(fuzzywuzzy,text=texte)