Giter Club home page Giter Club logo

Comments (6)

InsaneLife avatar InsaneLife commented on May 31, 2024 1

确实会有这个问题,我这边排查也没找到问题所在,猜测是数据集问题,所以进行了以下实验:

  • 数据:更换数据集为LCQMC口语化描述的语义相似度数据集(实在找不到其他公开的搜索点击数据集,用语义相似数据集实验),模型也从多塔变成了双塔模型,见siamese_network.py。
  • 结果:目前看在此数据集上测试数据集的准确率是提升的,所以猜测是数据集问题,看了oppo里面的似乎有些相同的query和doc,都没有被点击。。。

from dssm.

eshaoliu avatar eshaoliu commented on May 31, 2024

image
我也是,测试集loss甚至开始涨了

from dssm.

InsaneLife avatar InsaneLife commented on May 31, 2024

收到,这个周末会进行排查解决

from dssm.

eshaoliu avatar eshaoliu commented on May 31, 2024

确实会有这个问题,我这边排查也没找到问题所在,猜测是数据集问题,所以进行了一下实验:

  • 数据:更换数据集为LCQMC口语化描述的语义相似度数据集(实在找不到其他公开的搜索点击数据集,用语义相似数据集实验),模型也从多塔变成了双塔模型,见siamese_network.py。
  • 结果:目前看在此数据集上测试数据集的准确率是提升的,所以猜测是数据集问题,看了oppo里面的似乎有些相同的query和doc,都没有被点击。。。

辛苦啦

from dssm.

pika023 avatar pika023 commented on May 31, 2024

确实会有这个问题,我这边排查也没找到问题所在,猜测是数据集问题,所以进行了以下实验:

  • 数据:更换数据集为LCQMC口语化描述的语义相似度数据集(实在找不到其他公开的搜索点击数据集,用语义相似数据集实验),模型也从多塔变成了双塔模型,见siamese_network.py。
  • 结果:目前看在此数据集上测试数据集的准确率是提升的,所以猜测是数据集问题,看了oppo里面的似乎有些相同的query和doc,都没有被点击。。。

你好,我有两个小问题:
1、请问为什么这里bert作为特征提取器时,不考虑多塔模型呢?个人感觉DSSM的精髓之一就是在于用多塔结构放大了样本间的区别。
2、siamese_network.py里有个函数是siamese_loss,好像没有被使用过,请问这个函数里的out1、out2和loss的计算方式是什么样的方便讲一下吗?是否可以据此改造成bert多塔模型?

from dssm.

InsaneLife avatar InsaneLife commented on May 31, 2024

确实会有这个问题,我这边排查也没找到问题所在,猜测是数据集问题,所以进行了以下实验:

  • 数据:更换数据集为LCQMC口语化描述的语义相似度数据集(实在找不到其他公开的搜索点击数据集,用语义相似数据集实验),模型也从多塔变成了双塔模型,见siamese_network.py。
  • 结果:目前看在此数据集上测试数据集的准确率是提升的,所以猜测是数据集问题,看了oppo里面的似乎有些相同的query和doc,都没有被点击。。。

你好,我有两个小问题:
1、请问为什么这里bert作为特征提取器时,不考虑多塔模型呢?个人感觉DSSM的精髓之一就是在于用多塔结构放大了样本间的区别。
2、siamese_network.py里有个函数是siamese_loss,好像没有被使用过,请问这个函数里的out1、out2和loss的计算方式是什么样的方便讲一下吗?是否可以据此改造成bert多塔模型?

siamese_network.py中的SiamenseBert类就是bert双塔模型,由于LCQMC的数据集是query对,所以这里是双塔模型

from dssm.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.