洛谷 Dataset 代码征集公告

站务版

kkksc03 @ 2024-06-21 23:16:07

update:已经收集到了足够的用户授权。我们将逐步整理代码。

为了推动算法竞赛领域的学术研究和 AI 模型的发展,洛谷决定开放一个数据集项目。该项目旨在挑选一些经典的算法竞赛题目,公开题面和测试数据,并提供大量用户提交的代码。这个数据集将作为 LLM(大型语言模型)的训练和评估的 testbench,面向学术界开放使用。

我们诚挚地邀请各位洛谷用户成为我们的志愿者,共同参与这个项目的建设。

我们需要什么?

我们需要您授权洛谷整理您提交的部分题目的代码(C++ 和 Python),包括这些题目:

  • P5703 【深基2.例5】苹果采购

  • P5708 【深基2.习2】三角形面积

  • P5711 【深基3.例3】闰年判断

  • P1055 [NOIP2008 普及组] ISBN 号码

  • P1089 [NOIP2004 提高组] 津津的储蓄计划

  • P2669 [NOIP2015 普及组] 金币

  • P1428 小鱼比可爱

  • P1047 [NOIP2005 普及组] 校门外的树

  • P5733 【深基6.例1】自动修正

  • P1125 [NOIP2008 提高组] 笨小猴

  • P2241 统计方形(数据加强版)

  • P1036 [NOIP2002 普及组] 选数

  • P1059 [NOIP2006 普及组] 明明的随机数

  • P1803 凌乱的yyy / 线段覆盖

  • P1827 [USACO3.4] 美国血统 American Heritage

  • P1048 [NOIP2005 普及组] 采药

  • P3372 【模板】线段树 1

  • P4779 【模板】单源最短路径(标准版)

  • P2482 [SDOI2010] 猪国杀

  • 和其他的一些经典题目,还在挑选

您只需要在本贴回复任意内容,则视为授权提供您的代码。回帖后 5 分钟内,你可以选择删除回复,超过 5 分钟则无法撤回。

等一段时间后,我们会收集经过授权的用户代码,经过整理、脱敏后公开。

公开的数据集会有哪些内容

  • 题目的题面(中文/英语)和测试数据
  • 用户提供的代码
  • 评测记录表格(经过离散化后的用户ID、题目编号、评测状态)

数据集公布时,会展示贡献者的用户名,以示感谢(也可以选择匿名)。

我们相信,这个数据集将成为推动算法竞赛和 AI 领域发展的重要资源。感谢大家的贡献。


by _fairytale_ @ 2024-06-21 23:27:01

写过猪国杀的哥们必须支持


by Wf_yjqd @ 2024-06-21 23:27:35

所以怎么是些模拟题


by SkyWave @ 2024-06-21 23:28:12

支持学术


by N_z_ @ 2024-06-21 23:28:33

支持


by lbh666 @ 2024-06-21 23:28:43

支持


by SXqwq @ 2024-06-21 23:28:51

qpzc


by Jie_Xu_Sheng @ 2024-06-21 23:29:29

qpzc


by diqiuyi @ 2024-06-21 23:29:48

几乎都没写过,但是不管了


by 是青白呀 @ 2024-06-21 23:30:05

后排支持。


by elsc @ 2024-06-21 23:30:54

个人觉得猪国杀应该对大模型贡献比较大? 拿出最强的码力、优美清晰的码风去推动你谷和OI界前进吧!(> <)


上一页 | 下一页