ChatGPT pomógł mi przeanalizować opisy romansów

Tym razem ChatGPT pomógł mi przeanalizować opisy romansów i muszę przyznać, że kilka lat temu bardzo ułatwiłby moje życie.

Przeglądając materiały na temat literatury, trafiłem na ciekawe opracowanie dotyczące okładek romansów. Alice Liang przejrzała ich ponad 1 400 i zestawiła je w raporcie What does a happily ever after look like? We look at over 1,400 romance covers to find out what visuals are used. Moim zdaniem jest próbka wystarczająca, żeby zauważyć pewne trendy oraz zmiany w prezentacji tego gatunku literatury popularnej.

Waga opisu

Ku mojej uciesze autorka raportu opublikowała także surowe dane, w których znalazłem krótkie opisy poszczególnych książek. Ostatnio, w trakcie choroby, która mnie zmiotła z planszy na dwa tygodnie, rozważałem różne projekty, które mam zapisane w notatniku. Dotyczą głównie gamedevu, ale dane na temat romansów pomogły mi coś przetestować. W tym, nad czym ostatnio łamię sobie głowę, ważne role grają recenzje na Steamie oraz krótkie charakterystyki gier, jakich używają ich twórcy.

Z mojej, literaturoznawczej, perspektywy, intencja tych opisów jest podobna do tej, którą dostrzegam w literaturze popularnej. Mam jasno określone gatunki, ale dopiero z krótkiej, marketingowej prezentacji, dowiaduję się, o czym w zasadzie jest gra lub książka, jaka mnie interesuje. Zacząłem się zastanawiać nad tym, czy w danym gatunku istnieją tematy, które dodatkowo dookreślają prezentowany materiał? Treści marketingowe tworzy się z myślą o kliencie, żeby go zainteresować i sprzedać produktu, a więc koniecznie jest wyeksponowanie tego, co ma przyciągnąć i skłonić do zakupu.

Eksperyment z romansami

Z pomocą przyszedł mi ChatGPT. Używając narzędzia nocode Make (link afiliacyjny) opracowałem testowe zestawienie tematów, jakie są eksponowanie w opisach romansów. Nie zależało mi na przeanalizowaniu całego zbioru od Alice Liang, raczej chciałem sprawdzić, czy mój proces ma w ogóle sens i jakie dane będzie zwracał opracowany przeze mnie prompt. A po co zajmować się dodatkowo przeglądaniem informacji na Steamie, zbieraniem ich oraz opracowywaniem, skoro można wykorzystać gotowy zbiór?

Do czego takiego dane mogą się przydać? Moim zdaniem dobrze prezentują zmiany w zainteresowaniu odbiorców. Przykład? Buduję zbiór najlepiej sprzedających się gier niezależnych w 2023 roku. Mam informacje na temat gatunków oraz tagów ze Steama. To jest ważne w perspektywie widoczności samej produkcji. Co jeszcze, w jej opisie, wyciągają twórcy? Na jakie dodatkowe tematy stawiają? Co eksponują? Pewnie, że najważniejsze są zrzuty ekranu z gry oraz materiały wideo, ale jestem pewien, że na opisy niektórzy też zerkają.

Eksperyment przygotowałem w następujący sposób:

  • Za pomocą Make przesłałem opisy romansów do ChatGPT.
  • Wróciły do mnie trzy tematy, które były widoczne w opisie. Uznałem, że te teksty są krótkie i na potrzeby testu nie potrzebuję więcej informacji.
  • Dodałem wybrane przez ChatGPT tematy do arkusza, rozszerzając go o dodatkową kolumnę.
  • Gotowy zbiór pobrałem w formacie CSV i dodatkowo edytowałem za pomocą Pythona, aby otrzymać wykresy prezentujące tematy na przestrzeni lat.
  • Nie przetwarzałem wszystkich danych. Jedynie 400 rekordów, aby sprawdzić, czy to, co wymyśliłem, ma sens.
  • Nie usuwałem synonimów. Pobrałem dane po prostu tak, jak opracował je ChatGPT.

Gotowe wykresy

Mam opracowane dane od 2011 do 2014 roku. Wykresy znajdują się poniżej.

  • Na pierwszym miejscu wśród tematów dalej jest romans. Zbiór był ograniczony tylko i wyłącznie do tego gatunku, ale i tak w opisanych podkreślano, że ten element jest ważny.
  • Wśród kluczowych tematów przejawiają się takie wątki jak namiętność oraz miłość. Jeszcze mocniejsze podkreślenie tego, z czym odbiorca będzie miał do czynienia w romansie.
  • W 2012 roku w najpopularniejszych tematach znalazły się treści paranormalne. W kolejnych latach zanikają, aby w 2014 roku ustąpić miejsca erotyce.
    Zbiór na pewno nie jest wyczerpujący i dotyczy głównie literatury anglojęzycznej. Niemniej, już w takiej małej próbce, widoczne są zmiany w tematach podkreślanych w opisach książek. Właśnie takich zastosowaniach ChatGPT widzę przestrzeń do prowadzenia badań marketingowych oraz badań klientów. Myślę, że przy odpowiednio przygotowanym zbiorze, trendy mogłyby być jeszcze bardziej widoczne.

A ile mnie to wszystko kosztowało? Aby wygenerować, to opracowanie zużyłem 43 206 tokenów i zapłaciłem za nie 0.49$. Przypominam, że przejrzałem tylko 1/3 zbioru! Ile potrzebowałem na to czasu? Myślę, że razem ze sklejaniem skryptu w Pythonie z innych skryptów, które miałem, opracowanie wykresów zamknęło się w 90 minutach.

Przyznaję, że widzę więcej zastosowań dla ChatGPT. Jednak daleki jestem od całkowitego wykluczenia człowieka z całego procesu. Uważam, że w przypadku szeroko rozumianego user research spojrzenie interfejsu białkowego jest w stanie odpowiednio sprofilować uzyskane dane.