Giter Club home page Giter Club logo

multicore_sysu_slides's Introduction

多核程序设计与实践

Course sildes will be uploaded to this repo.

Supplementary materials for assignments will also be post here.

Notification!

  • 2019-06-04: 「For Class」Tonight's class will be cancelled due to thunderstorm rain. Moreover, the mid-term examination papers will be handed out next week.

  • 2019-05-03: 「For Class」An offline question and answer class will be held on May 7th(Tuesday). Any question about assignments and the final project can be asked.

  • 2019-04-04: 「For Assignments」The output time of the program will not be included in the performance evaluation section.

News!

  • 2019-07-22: Upload mid-term-examination-final-grade.xlsx and final-project-final-grade.xlsx, update homework-03-final-grade.xlsx and homework-02-final-grade.xlsx.
  • 2019-07-15: Update homework-03-final-grade.xlsx, upload evaluation code in Supplements/hw3-evaluation-codes, please see the README.md to evaluation your program.
  • 2019-07-13: Upload homework-03-final-grade.xlsx, update homework-01-final-grade.xlsx and homework-02-final-grade.xlsx
  • 2019-06-20: Upload homework-03 samples files in ./Supplements/hw3-sample-files and standard homework-03-standard.md
  • 2019-06-16: Upload homework-02-final-grade.xlsx and final-project-list&order.xlsx. Update homework-01-final-grade.xlsx.
  • 2019-05-28: Upload CUDA-12.pdf
  • 2019-05-21: upload the standard output data file 'performance_standard.txt' we use to test performance
  • 2019-05-21: upload the input data file 'pdata.bin' we use to test performance
  • 2019-05-21: Upload CUDA-11.pdf
  • 2019-05-21: Update homework-01-final-grade.xlsx with comments
  • 2019-05-20: Upload homework2.py. It shows how the answer is worked out.
  • 2019-05-15: Upload CUDA-HW-2.pdf. Fix some mistakes in CUDA-10.pdf
  • 2019-05-15: Upload homework-01-final-grade.xlsx into Supplements. Update cuda_output.txt to match convolution result (s=1), you can validate your program with the given output.
  • 2019-05-14: Update CUDA-10.pdf
  • 2019-05-09: Add CUDA-10.pdf
  • 2019-05-07: Add homework-02 sample files. Add cuda_output.txt as a sample output file (s=2). Add test.sh as a test script. Other assignments standard is also post in 多核程序设计作业标准.md
  • 2019-05-03: Add slides CUDA-09.pdf and update CUDA-08.pdf
  • 2019-04-17: Add slides CUDA-08.pdf
  • 2019-04-14: Add slides CUDA-07.pdf
  • 2019-04-03: Add slides CUDA-05.pdf and CUDA-06.pdf and update CUDA-04.pdf
  • 2019-03-27: Add homework-01 sample programs and files to Supplements directory
  • 2019-03-26: Add a tutorial for compiling your own GCC-6.5.0
  • 2019-03-26: Add a sample output file (s=2) for homework-01

multicore_sysu_slides's People

Contributors

henryliu0 avatar multicoresysu avatar why116600 avatar williamsysu avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

multicore_sysu_slides's Issues

第一次作业nvprof疑问

TA你好,我是16337159 刘晓瑞
最新的成绩excel表格上我的备注是nvprof没有对应核函数时间:
image

但是我在集群上运行时有核函数的运行时间:
image

第一次作业修改

TA你好,我是学号为16339061的庄钟嵛。我第一次作业因为语言问题无法通过集群上的编译,现已改正,希望TA能够帮我重新批改一下作业。
[图片]

作业2成绩问题

ta您好,我的学号是16337107,在评分表中提示我的输出结果全为0,但是我重新测试后输出结果并不是这样的,输出结果不为0且正确
image

作业一OpenMP编译失败问题

make

师兄,我自己用提交的Makefile文件和OpenMP.c在集群上是可以编译运行的,不清楚为什么成绩里指出“OpenMP编译失败”? 我的学号是16337153

作业二成绩问题

TA你好,我是张奕勋(学号16337314),作业二提交因为编码问题出现编译错误。我检查后发现是添加注释后系统自动修改了编码格式,向老师询问后允许重新提交。我重新提交版本的代码仅修改了注释部分,其他代码没有更改,请重新评成绩。

第一次作业仍未有成绩

image

TA你好,我是郭锦鸿,学号16337068。第一次作业仍未有成绩,已经重发了两次作业邮件了,但至今未有回复或者成绩更新,麻烦TA能检查一下,图为当时交作业的时间证明。

作业2成绩问题

TA你好,我是16339028刘远,hw2作业我在提交压缩包时由于疏忽,提交了不正确格式的压缩包,导致成绩表中未显示我的名字。已使用正确的格式重新发送邮件,所有代码均未改动,请您评成绩。已确保在集群能够解压运行。附作业截止日期前发送邮件的截图
作业2邮箱发送记录

作业1性能评测方法的问题

在excel表格中我的成绩是22ms,猜测TA使用nvprof进行评测,但是我自己评测时高斯函数计算只用了200us,其中GPUactivity总共是22ms,包括了设备内存拷贝到主机内存的时间。

但是参考并评测了另一位成绩为1ms的同学的代码,同样使用nvprof评测。GPUactivity总共是90多ms,其中高斯函数计算是1ms,内存拷贝90ms。

请问能否麻烦TA公布性能评测方法以及对正确性进行核实,谢谢TA!

可以通过conda安装gcc

# 4.8.5
conda install -c anaconda gcc 
# 5.4.0
conda install -c bonsai-team gcc-5 
# 6.1.0
conda install -c omgarcia gcc-6 

自行选择喜欢的版本安装
已知缺陷:每次重启后除个人目录外的文件都会被清楚
可尝试自行编译gcc-6,安装在个人目录并添加到PATH。

作业2输出样例问题

TA你好,你给出的data.bin的标准输出与data.bin好像不匹配,是否应该更新data.bin?另外performance_standard.txt这个文件中每一项之间没有用空格隔开。

另外TA应该是用python算出来的结果,但是与同学们用CUDA算出来的很多地方差0.01,这个精度问题很难修改。

另外能否把第一次作业的性能评估使用的s=1000的测试结果给出来?

作业一

请问助教能不能提供一个联系方式,我的输出多了换行(因为我是对照ppt的,抱歉),这导致了我的答案错误,能否宽容一下。

第一次作业成绩文档中没有找到我的成绩

老师您好,我的学号是16337200,对应md5哈希值为eda5200d1a5ec9a474a5e6599c49436b。第一次作业成绩单中没有找到我的成绩。以下是我4月8日提交作业的邮件截图。麻烦您让助教师兄检查一下是不是忘记批改了我的作业?【我刚刚也发送我的作业和截图到作业邮箱[email protected]了】
image

关于作业二的运行效率

TA您好,我在实验报告里已经讨论过线程数设置的情况,但是提交的作业二代码中,线程数忘了修改成合适的大小,导致运算效率比较低。
想问下线程数能不能修改成合适的大小,再测试一次? 16337153 凌笑铃
实验报告:
a
提交代码参数设置:
c

咨询作业二性能评估方法

请问作业二中将如何评估程序性能,是否会将利用作业一中的代码计算高斯卷积核的时间也算入在内?还是仅计算名为kernel的核函数的运行时间?

作业二成绩问题

TA好,我是黄子聪(16337101),作业结果说我是

运行出错,Error: hw2_cuda.cu:110, code:2, reason: out of memory

我自己在集群上按照正常流程测试是可以出结果的,并没有出现内存问题,有可能是当时TA测试的时候集群上正好有其它程序占用资源导致,希望TA能够重新进行测试,谢谢。

作业二成绩疑问

助教您好!我叫王锡淮,学号是16337236,我在提交时交了多次,最后一次是
image
请问您是否使用的这一份代码

以及请问您测试时使用的卷积核大小是多少?我用s=1、s=2测试时的结果如下:
image

作业一没有成绩

TA你好,我叫李智源,学号16337129,第一次作业成绩单没有找到我的成绩。麻烦您再查看一下。

hw1成绩更新疑问_

TA您好,我是谢江钊,学号16337259,今天的成绩更新后我的分数没有得到加上去,备注是程序运行结果错误,我已经在集群上测试,希望您能够回复我具体的原因是什么
Snipaste_2019-06-16_14-01-34
我的代码在集群上能够正常解压和编译,
我另外创建了out_std.py用于Python生成标准结果和cmp.py用于对比生成结果,结果数据是正确的
Snipaste_2019-06-16_14-14-06
因此我想到也许是您这边的脚本要求直接输出结果而不是文件,因此我改变了输出结果到终端而不是文件。
希望您能够重新帮我测试一次代码,这门课对我非常重要,希望能够得到相应的成绩,再次麻烦您批改了,谢谢~
相关代码已经重新压缩发送到Multicode邮箱,没有改动函数等内容,只是把之前注释的输出函数恢复回来,谢谢

HW2交错代码了怎么办

第二次成绩,看到成绩只有28分,说是因为结果是全零,去查看了一下邮件记录,发现上次好像是慌慌张张交错了代码,把正确的代码发到邮箱了,想问一下TA成绩还有救吗QAQ

作业一成绩问题

师兄,第一次作业总分那一列好像加错了,虽然计算的式子是对的,但有些行手动算的结果不对,我的成绩是第四十行好像也不对

关于作业二答案的问题

助教好,关于作业二的答案,班里的很多同学都算不出您给出的答案,不知道助教方不方便给出样例中的卷积核以及您的padding方式,还有卷积公式。

作业一成绩相关

师兄您好,我的学号是16337104,关于我的openmp程序的结果不对是因为在调试的时候把输出函数注释了,请问能去掉注释再测试一下吗?

作业三示例代码

image

这里应该是 arg!=3
然后test.sh里面应该也是忽略了有两个命令行参数这件事。

第一次作业修改

第一次作业因编码问题无法在集群上运行。已使用正确的方式编码并在2周前重新发送了邮件,目前成绩还未修改。
附邮件发送截图。
邮件提交记录截图 (1)

第一次作业重交(解决了原来集群上gcc版本问题)

TA你好,我之前重交过一次hw1,解决了其中操作系统不兼容的问题,但仍存在gcc版本过高不可以使用集群上nvcc的问题,现已改正此问题。我已将修改后的hw1压缩包发送至作业邮箱,烦请接收批改,谢谢!
屏幕快照 2019-06-11 下午8 10 18

作业二输出结果精度问题

作业2中大部分结果都没问题,个别结果与用python脚本算出来的结果相差0.01,请问是什么原因?
(PI的值我设置成3.14159265359)

第一次作业正确性

image
按图上说我的makefile 的名字不对,我不知道是怎么回事,我在这里能无毛病地跑。我在做第二作业的时候我也同时在改makefile,有可能这个问题导致出这个错。

第一次作业成绩单中没有找到我的成绩

老师您好,我的学号是15323032,对应md5哈希值为09f300dec4b3499a260b65070ede68e4
。第一次作业成绩单中没有找到我的成绩。以下是我4月8日提交作业的邮件截图。麻烦您让助教师兄检查一下是不是忘记批改了我的作业?
image

第一次作业修改

hw1
TA你好,我是周子豪,学号16339060。第一次作业出了问题,已做相应修改,希望你能重新批改一下,谢谢。

作业二成绩计算问题

我发现在作业二的评分中准确性只给了30分,但是在作业二的要求那里写的是准确性有40分,请问TA是不是将讨论性能优化的额外10分算到了总成绩里,而把准确性的分数降低了。

第一次作业没有我的成绩

老师你好,我叫黄维哲,我的学号是16337096,MD5加密的HASH值是c94f554a2121ee7fb239f1fadcc398f3,我在第一次作业的表格上找不到我的成绩,不知道是ta忘记加上去还是没收到我的邮件

image

作业三

助教,想问作业三的详情什么时候上线,期末考试时间就快要到了,希望详情能快点出来。

第一次作业重交

TA你好,我在5.25重新提交过了作业1,已发送邮件,希望TA能够改一下然后更新一下成绩,谢谢!
image

第二次作业核函数命名

TA你好,我作业2中因为生成卷积核和卷积都用到了核函数,所以两个核函数命名为guass2d_kenal,convolve_kernal。convolve_kernal是卷积运算所用的时间。

很抱歉没有注意到作业2要求核函数命名为kernal,希望TA能够看一下convolve_kernal核函数的运行时间,谢谢

作业一“OpenMP源程序为乱码,集群无法正确编译”问题

师兄你好,我的学号是16337200。

  1. 我的openMP源程序是乱码是因为其中带有中文注释(编码方式为GB2312)
  2. 关于“集群无法正确编译”的问题:我在集群上面进行了编译运行后发现是正确的,编译运行结果截图如下:
    image
    希望师兄可以帮忙重新查看一下,谢谢!

hw1成绩更新疑问

TA您好,我是16337208石邢越,今日hw1成绩更新我有以下3个疑问:

  1. 成绩更新前我的优化分数为10分,为何更新后减为3分?是因为重交时没有再重复提交原来的报告吗?
  2. 批改说明中的“OpenMP文件错误”是指什么呢?在集群上这个文件的编译和运行应该都是没有问题的。
  3. 批改说明中的“没有核函数”是指什么呢?我的CUDA代码中包含了核函数gauss,是指需要像hw2的要求一样改名成kernel吗?

这门课的成绩对我非常重要,希望可以尽快解决这些问题得到相应分数。多次麻烦您批改了不好意思…
恳切希望尽快收到您的答复!

image

关于作业一成绩问题;

TA你好,我是16339048武康康,第一次作业由于Makefile文件不正确导致无法编译,并且实验报告没有分数;出成绩后邮件咨询TA实验报告0分问题未得到回复;5月27日重新提交了正确的Makeflie、代码、报告打包文件以及是否做了改动,未得到更新后的成绩;希望TA可以抽空重改一下,谢谢;

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.