Gibt es so etwas? Ich habe toB-Unternehmensinformationen erhalten, aber es gibt keine Firmennummer in CRM. Es gibt grundlegende Informationen wie den Firmennamen und das Gründungsjahr. Was sollte in einem solchen Fall als Join-Schlüssel verwendet werden, wenn mit einem Datensatz einer anderen Liste verbunden wird? Ich glaube, ich mache mir Sorgen.
Alle Unternehmensinformationen können zu einer Information zusammengefasst werden, sofern eine von der Regierung festgelegte Unternehmensnummer vorliegt. Angenommen, Sie möchten Tabelle A und Tabelle B wie folgt verbinden:
Tabelle A (Unternehmensinformationen)
Name der Firma | Gründungsjahr | Präfekturen |
---|---|---|
hoge | fuga | 3 |
Tabelle B (Kontaktinformationen)
Name der Firma | Geschätzter Betrag | Bestellstatus |
---|---|---|
hoge | 3000 | Erste Verbindung |
Jeder, der mit Datenbanksprachen wie SQL in Kontakt gekommen ist, wird es wissen. Die DB-Last wird auf die Kombination von Zeichenfolgen angewendet. Solange Sie eine Unternehmensnummer haben, können Sie diese als allgemeinen Kombinationsschlüssel verwenden. Wenn Sie eine Unternehmensnummer erhalten möchten, ist gbizinfo vom Ministerium für Wirtschaft, Handel und Industrie praktisch. Es hat diesen Service REST API! Es ist also sehr einfach, eine Unternehmensnummer zu erhalten. https://info.gbiz.go.jp/api/index.html
Später wird ein X-hojin-Info-API-Token für die Header-Informationen benötigt. Sie müssen die API-Nutzung im Voraus beantragen.
Angenommen, Sie haben Daten, die nur den Firmennamen und das Gründungsjahr enthalten, wie unten gezeigt. Ich möchte die Firmennummer in diese Daten aufnehmen. Die Methode zum Zeitpunkt der Anforderung ist GET
Name der Firma | Gründungsjahr |
---|---|
Rakuten Mobile Co., Ltd. | 2018 |
Matsuya Foods Co., Ltd. | 2018 |
request.py
import json
import pandas as pd
import requests
class CorporateNumbers:
def __init__(self):
self.headers = {
"Accept": "application/json",
"X-hojinInfo-api-token": "###token###"
}
self.endpoint_url = 'https://info.gbiz.go.jp/hojin/v1/hojin'
def _create_taeger_company_dataframe(self):
df = pd.read_clipboard()
return df
def _get_corporate_number(self,df):
#df = self._create_taeger_company_dataframe()
name = df.name
founded_year = df.founded
results = []
for name,founded in zip(name,founded_year):
data = {
'name':name,
'founded':founded
}
res = requests.get(
url = self.endpoint_url,
headers = self.headers,
params = data
)
json = res.json()['hojin-infos']
results.extend(json)
df = pd.io.json.json_normalize(results)
return df
def _merge_dataframe(self):
df1 = self._create_taeger_company_dataframe()
df2 = self._get_corporate_number(df = df1)
df3 = pd.merge(df1,df2,on='name',how='left')
return df3
Recommended Posts