[PYTHON] Ich habe AI im Netz patrouillieren lassen und einen Webdienst für das Gadget-Ranking erstellt, der einmal pro Woche aktualisiert wird

Vorwort Ich mag Gadgets. Ich liebe sowieso Gadgets.

Vor allem ist er außerordentlich besessen von Tabletten. Vor ungefähr 7 oder 8 Jahren kaufte ich ein Gerät namens Surface RT, auf dem steht: "Dieses ist perfekt zum Arbeiten und Spielen!" Die Reise zum besten Tablet, die endlos ist und gleichzeitig Geld ausgibt, geht weiter.

Aus diesem Grund überprüfe ich die Gadget-Site ziemlich oft. Wenn Sie andere technische Medien, Leak-Sites und alle anderen Gadget-bezogenen Sites wie 9to5mac in Übersee einbeziehen, werden Sie jeden Tag stundenlang lesen.

Ja, lassen Sie Python die Probleme machen. </ b>

Was ich gemacht habe https://gadget-busters.com ![image.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/696052/dd0a55fe-71cd-314f-b725-ce8b58a35d08.png)

Dies. Es ist zu sehen, dass der Name Gadget Busters nur ein Slapstick eines Programms namens Miss Busters und ein Gadget ist, das mir früher gefallen hat, und ich habe an nichts Besonderes gedacht.

Einmal pro Woche werden die Gadgets, die das Thema der Woche sind, in einem Ranking-Format veröffentlicht. Ich denke, ich kann es allen empfehlen, die die Gadgets, die das Thema sind, jetzt schnell kennenlernen möchten.

Am Backend werden Artikel im Internet gecrawlt und Produktnamen aus Artikeln extrahiert, die sich auf Gadgets beziehen, wobei die Verarbeitung natürlicher Sprache und selbst erlernte Vorhersagealgorithmen verwendet werden. Danach wird eine Punktzahl vergeben und ein Ranking erstellt.

Grundsätzlich werden die Gadgets, die mehrmals auf mehr Websites erwähnt werden, als Gadgets dieser Saison eingestuft. Da es jedoch die Möglichkeit gibt, dass "ich bereits weiß", nur durch die Anzahl der Auftritte, versuche ich, den idf-ähnlichen seltenen Produktnamen im Algorithmus zu übernehmen. Insbesondere haben wir einen Abschnitt eingeführt, in dem hochfrequente Keywords auf weniger Websites hervorgehoben werden.

Der obige Vorgang wird automatisch einmal pro Woche ausgeführt, um die oben genannte Site zu aktualisieren.

Zukünftige Entwicklung

Sobald die Daten gesammelt sind, möchte ich eine Seite erstellen, auf der Sie das monatliche Ranking, das jährliche Ranking und die Trendübergangsliste der Gadgets sehen können. Was ist mit dem Gerät passiert, das 2015 beliebt war? Wenn Sie zu diesem Zeitpunkt auf die Website 2015 klicken, können Sie den Übergang des Trends zusammen mit der Zeitleiste sehen. Der Name ist ... Gadget Time Machine?

Außerdem möchte ich den Algorithmus des Teils zur Extraktion des Produktnamens etwas detaillierter gestalten, um kein Rauschen aufzunehmen. Insbesondere wird die Wiederholung von Produktnamen in Anzeigen ignoriert. Ich möchte das Design zu einem Ocean Tee machen und freue mich auf Ihre weitere Unterstützung von Gadget Busters.

Verwendete Technologie - Web krabbelt --Verarbeitung natürlicher Sprache --Maschinelles Lernen - Ranglisten-Algorithmus - FastAPI - React + Material-UI - AWS

Recommended Posts