洛谷 Dataset 代码征集公告

站务版

kkksc03 @ 2024-06-21 23:16:07

update:已经收集到了足够的用户授权。我们将逐步整理代码。

为了推动算法竞赛领域的学术研究和 AI 模型的发展,洛谷决定开放一个数据集项目。该项目旨在挑选一些经典的算法竞赛题目,公开题面和测试数据,并提供大量用户提交的代码。这个数据集将作为 LLM(大型语言模型)的训练和评估的 testbench,面向学术界开放使用。

我们诚挚地邀请各位洛谷用户成为我们的志愿者,共同参与这个项目的建设。

我们需要什么?

我们需要您授权洛谷整理您提交的部分题目的代码(C++ 和 Python),包括这些题目:

  • P5703 【深基2.例5】苹果采购

  • P5708 【深基2.习2】三角形面积

  • P5711 【深基3.例3】闰年判断

  • P1055 [NOIP2008 普及组] ISBN 号码

  • P1089 [NOIP2004 提高组] 津津的储蓄计划

  • P2669 [NOIP2015 普及组] 金币

  • P1428 小鱼比可爱

  • P1047 [NOIP2005 普及组] 校门外的树

  • P5733 【深基6.例1】自动修正

  • P1125 [NOIP2008 提高组] 笨小猴

  • P2241 统计方形(数据加强版)

  • P1036 [NOIP2002 普及组] 选数

  • P1059 [NOIP2006 普及组] 明明的随机数

  • P1803 凌乱的yyy / 线段覆盖

  • P1827 [USACO3.4] 美国血统 American Heritage

  • P1048 [NOIP2005 普及组] 采药

  • P3372 【模板】线段树 1

  • P4779 【模板】单源最短路径(标准版)

  • P2482 [SDOI2010] 猪国杀

  • 和其他的一些经典题目,还在挑选

您只需要在本贴回复任意内容,则视为授权提供您的代码。回帖后 5 分钟内,你可以选择删除回复,超过 5 分钟则无法撤回。

等一段时间后,我们会收集经过授权的用户代码,经过整理、脱敏后公开。

公开的数据集会有哪些内容

  • 题目的题面(中文/英语)和测试数据
  • 用户提供的代码
  • 评测记录表格(经过离散化后的用户ID、题目编号、评测状态)

数据集公布时,会展示贡献者的用户名,以示感谢(也可以选择匿名)。

我们相信,这个数据集将成为推动算法竞赛和 AI 领域发展的重要资源。感谢大家的贡献。


by chenyy @ 2024-06-21 23:36:04

支持


by I_am_kunzi @ 2024-06-21 23:36:21

好巧啊,正好卡到 cz 前一个


by cff_0102 @ 2024-06-21 23:37:42

我可不可以乱交代码,


by piiritys @ 2024-06-21 23:38:39

qpzc


by EasonLiang @ 2024-06-21 23:39:18

qpzc


by thdlrt @ 2024-06-21 23:39:18


by z__j__y @ 2024-06-21 23:39:33

《前排撅kkk》


by PigNotFound @ 2024-06-21 23:39:35

qp


by qwertsdfgh @ 2024-06-21 23:40:34

111


by FurippuWRY @ 2024-06-21 23:41:40

你说的对,但是,后面忘了。


上一页 | 下一页