Necessario avere un raggio più ampio per la vendita di appunti <a target="_blank"

<a class="user-mention notranslate" data-hovercard-type="user" data-hover

Si potrebbe pensare di chiederlo a un modello xD? <a target="_blank" rel="noopener

Buongiorno ragazzi <a class="user-mention notranslate" data-hovercard-type="user" data

Ciao <a class="user-mention notranslate" data-hovercard-type="user" data-hovercard-url

Per me ok <a class="user-mention notranslate" data-hovercard-type="user" data-hovercar

<a class="user-mention notranslate" data-hovercard-type="user" data-hovercard-url="/us

Vendo appunti troppo specifico about informabot HOT 13 OPEN

ali-benny commented on July 3, 2024 1

Vendo appunti troppo specifico

from informabot.

Comments (13)

bogo8liuk commented on July 3, 2024 1

@bogo8liuk https://arxiv.org/abs/1607.01759? Mi sembra sia figo questo, permette anche classificazione con training ez e supporta italiano, huggingface lo ha senza problemi, ci sono già word embedding in italiano per dire https://huggingface.co/facebook/fasttext-it-vectors Se ho tempo stasera lo provo.

https://github.com/facebookresearch/fastText?tab=readme-ov-file#text-classification (questo dovrebbe essere allenato da zero credo !?)

Uh sembra molto carino, inoltre utilizza veramente poche risorse, lo terrò in considerazione.
Io sto utilizzando la libreria spaCy https://spacy.io/ , che fa una cosa abbastanza simile a quello che hai proposto e ha anche il supporto per l'italiano.

from informabot.

samuelemusiani commented on July 3, 2024

Per ora il bot risponde soltanto se nel messaggio si trova la combinazione di parole vendo appunti. Se cambia anche solo leggermente, come riportato nell'esempio sopra, il bot non viene più triggerato. Sarebbe quindi carino espandere l'euristica per fare in modo che il bot riconosca anche altre frasi

from informabot.

Flecart commented on July 3, 2024

Si potrebbe pensare di chiederlo a un modello xD?

Forse si può trainare un embedding ad hoc e comparare una sorta di distanza!?. Non so se esistono metodi che danno una sorta di distanza semantica fra frasi...

from informabot.

samuelemusiani commented on July 3, 2024

È abbastanza divertente come venga scritto qualcosa solo quando la issue è stata chiusa ahahah. Comunque a parte gli scherzi: da un certo punto di vista sono consapevole che un AI sia decisamente meglio dell'euristica implementata da me per riconoscere variazioni della stessa frase. Allo stesso tempo però mi vengono un po' di dubbi:

Questo modello come lo vorresti creare? Sarebbe integrato direttamente nella repo del bot? Sarebbe parte del bot stesso o opzionale?
Quante risorse potrebbe chiedere il modello per girare e riconoscere questo tipo di frasi?
Come facciamo a trainarlo se la frase che abbiamo in input nelle autoreplies è solo "vendo appunti"? Se ne aggiungiamo un'altra non dovrebbe essere necessario rifare il training giusto?

from informabot.

Flecart commented on July 3, 2024

Dovrei fare delle ricerche, per rispondere a 1, sarebbe direttamente dentro al bot, come dipendenza per fare questa operazione.
2. Sicuramente il modello in immagine è out of scope per noi.

Per il punto 3 anche questo si dovrebbe andare a cercare.
A pancia dovremmo trovare qualcosa che semplicemente faccia un embedding per il contesto, e poi lo andiamo a confrontare con quanto è distante rispetto a "vendo appunti".
Word2Vec fa embedding, ma non lo conosco bene e non so se si può adattare a questi usi, dovrei leggere qualcosina per risponderti bene.

from informabot.

samuelemusiani commented on July 3, 2024

Allora se hai voglia puoi guardarci, appena hai una idea di come potremmo fare ci risentiamo

from informabot.

bogo8liuk commented on July 3, 2024

Buongiorno ragazzi @Flecart @samuelemusiani , io e un mio collega della magistrale volevamo estendere la funzionalità proprio con un modello (volevamo portare avanti questa cosa come progetto dell'esame di IA per la magistrale). Se volete si può iniziare una collaborazione o, se qualcuno ci sta già lavorando, provare a vedere i modelli più precisi, il tutto con una sana competizione :)

from informabot.

samuelemusiani commented on July 3, 2024

Ciao @bogo8liuk! Io non ci sto lavorando quindi aspetterei una risposte di @Flecart per capire se lui ha già iniziato a fare qualcosa. Comunque per me potete tranquillamente lavorarci anche per vedere cosa viene fuori. Alcuni dubbi però mi rimangono in base a come gestire la cosa a livello del bot:

Quante risorse potrebbe chiedere il modello per girare e riconoscere questo tipo di frasi?

Come facciamo a trainarlo se la frase che abbiamo in input nelle autoreplies è solo "vendo appunti"? Se ne aggiungiamo un'altra non dovrebbe essere necessario rifare il training giusto?

from informabot.

Flecart commented on July 3, 2024

Per me ok @bogo8liuk! Fai pure.

from informabot.

bogo8liuk commented on July 3, 2024

@samuelemusiani per rispondere alle tue domande:

Quante risorse potrebbe chiedere il modello per girare e riconoscere questo tipo di frasi?

Questo sarà probabilmente il punto più critico da verificare, nel senso che purtroppo non lo so ancora. Io e il mio collega non utilizzeremo modelli come code-llama o simili; quello che cercheremo di fare sarà di creare un modello "quasi da zero".

Come facciamo a trainarlo se la frase che abbiamo in input nelle autoreplies è solo "vendo appunti"? Se ne aggiungiamo un'altra non dovrebbe essere necessario rifare il training giusto?

Noi andremo a misurare proprio la similarità (qualunque cosa voglia dire) con "vendo appunti". Tuttavia, ciò che ci interessa individuare in un messaggio è il concetto di vendita di risorse didattiche, quindi al momento ti direi che non è necessario.

from informabot.

bogo8liuk commented on July 3, 2024

Comunque direi che si può riaprire la issue

from informabot.

samuelemusiani commented on July 3, 2024

Perfetto @bogo8liuk, aspetteremo tue notizie

from informabot.

Flecart commented on July 3, 2024

@bogo8liuk https://arxiv.org/abs/1607.01759?
Mi sembra sia figo questo, permette anche classificazione con training ez e supporta italiano, huggingface lo ha senza problemi, ci sono già word embedding in italiano per dire https://huggingface.co/facebook/fasttext-it-vectors

https://github.com/facebookresearch/fastText?tab=readme-ov-file#text-classification (questo dovrebbe essere allenato da zero credo !?)

from informabot.

Vendo appunti troppo specifico about informabot HOT 13 OPEN

Comments (13)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent