🌐 GraphRAG 开发者挑战赛——法律文档处理(原型) 职位类型: 合同 / 自由职业 报酬方式: 仅在通过评测(总体得分 95% 以上)后支付 开发周期: 从接收材料起 7–10 天内完成现场演示 项目范围: GraphRAG 原型(无前端、无生产环境) 我们正在寻找一位紧跟当前图结构检索(Graph-based Retrieval)研究的专家,能够为法律文档设计一个高精度 GraphRAG 管道系统。 本项目不是聊天机器人或界面开发项目,也不是比拼延迟速度的竞赛。 系统可包含多跳检索或智能 Agent 调度。 知识图谱的构建与遍历属于项目范围。 ⚠️ 必须实现 GraphRAG,而非普通的 RAG! 📂 你将获得的资料 /docs/ → 10 份预处理的 Markdown 法律文档(包含丰富元数据) /sample_questions.json → 2 个示例问题(格式参考) /sample_answers_rag.json → 2 个示例答案(风格与结构参考) 以上仅为格式参考。正式评测将使用未公开的新问题。 🛠️ 你需要完成的内容(仅限原型阶段) 请在 Python 3.12 环境下(Poetry 项目结构)实现以下两个函数: def ingest(document_paths: List[str]) -> None: """导入提供的法律 Markdown 文档,构建知识图谱等。""" def query(questions: List[str]) -> List[str]: """返回基于检索结果的答案,并使用 Vancouver 风格的引文格式。""" 要求: 无需前端 UI、无需 API Key、无需云环境; 可使用任意技术栈,重点在于方法与结果; query(...) 必须支持并行执行,并能在终端显示进度; 在 60 分钟的现场测试中需处理约 400 个问题。 🧪 评测与报酬(如何获得支付) 你在本地使用示例文件进行开发与调试; 现场测试时(60 分钟内),我们提供约 400 个新问题; 你运行 query(...) 并生成 /answers.json 文件; 我们使用 LLM 作为评测者对你的答案进行打分(你无需构建评估框架)。 若你的总体得分在以下四项指标中超过 95%,则视为通过: 忠实性(Faithfulness):无幻觉,回答内容来源明确; 相关性(Relevance):检索内容与问题高度匹配; 完整性(Completeness):覆盖问题的所有关键要点; 清晰度(Clarity):结构清晰、逻辑严谨、法律表达规范。 通过后需提交完整代码库(包含仓库、Poetry 锁文件、运行说明及技术说明文档)。 我们验证可复现性后支付报酬,并考虑与你签订长期合作。 注意事项: 不使用 F1 指标; 不考察延迟时间; 官方统一运行评测; 若未通过评测 → 无报酬,你保留代码所有权;不做例外处理。 英文版:We’re hiring an expert who follows current graph-based retrieval research and can design a high-accuracy GraphRAG pipeline for legal documents. This is not a chatbot/UI project and not a latency contest. The system may include multi-hop/agentic orchestration. Knowledge-graph construction and traversal are in scope. Must be GraphRAG not vanilla RAG! ---------------------------------------------------------------------- 📂 What You Receive - /docs/ → 10 pre-processed Markdown legal documents (rich metadata) - /sample_questions.json → 2 sample questions (format reference) - /sample_answers_rag.json → 2 sample answers (style/structure reference) These are for orientation only. The live benchmark uses unseen questions. ---------------------------------------------------------------------- 🛠️ What You Must Build (Prototype Only) Expose exactly two Python functions (Python 3.12, Poetry project): def ingest(document_paths: List[str]) - None: """Ingest the provided legal markdown documents, build knowledge graph etc.""" def query(questions: List[str]) - List[str]: """Return answers as strings with Vancouver-style citations grounded in retrieved sources.""" - No UI, no API keys provided, no cloud required - Use any stack—we care about your approach and results, not tools - query(...) must support parallel execution to process ~400 questions in the 60-min live session. Must show a progress indicator in the terminal. ---------------------------------------------------------------------- 🧪 Demo & Evaluation (How You Get Paid) - You implement locally using the samples for orientation - Live 60-min session: we provide ~400 questions - You run query(...) live and produce /answers.json - We run the benchmark (LLM-as-judge) on your answers; you don’t need to build an evaluation framework If your overall score is more than 95% across: • Faithfulness (no hallucinations; grounded in retrieved text) • Relevance (retrieval matches the query) • Completeness (key points fully covered) • Clarity (clear, structured, legally coherent) You hand over the entire codebase (repo, Poetry lock, run instructions, and short tech note). Payment is released only after you deliver the full repo and we verify reproducibility. You are considered for hiring/further engagement. NOTE: - We do not use F1 - We do not measure latency - We run the benchmark - Fail → No payment; you keep your code. No exceptions
给任意一台windows设备上放置一个文件,该文件需要得到授权后才能被其他软件使用 功能: 1.未授权的设备自动弹出购买卡密 2..购买卡密后,文件才可以保留在电脑上(没网络可以保留,但是设备联网后文件需要自动被删除且不可找回) 3.定时检查卡密是否过期,如果过期且已经加载到相应的程序中,程序会退出 具体场景见附件
总体任务:工具类网站的后端设计,API+后端服务器+数据库 ①账户系统:包含常见的功能,比如注册,找回密码等,都很老套(要求也可以通过gmail登录)。 ②网站服务: 网站包含多个工作流,每个工作流中有多项服务,比如大模型,TTS,OCR,STT等技术,(所有技术已经训练好,只需要部署到云服务器上), 用户上传文件给大模型(已经训练好,只需要部署到云服务器上),文件类型包括网页(爬虫爬成文本),doc文档,连接到邮箱(gmail的接口,可以爬所有邮件),pdf,xlsx,mp3,typora的文档 上传文档之后传输给大模型,跑完之后,可以开始chatbot问问题或者直接生成调研文档 ③在AWS上部署 ④未来工作流会增加很多种类型,另外关于大模型的响应时间,目前消费级显卡5min出结果,要求每分钟内至少接受1000次请求,最高10000次,60s内出结果,负载均衡+微服务,AWS提供了很多服务帮助实现。 ⑤加密,比如用户读取结果需要秘钥,关于加密算法直接用welldefined的就可以了,但是这个可以后面再说 请先考虑一个大体报价给我,合适的话我给具体功能文档
问题描述: 在电网中,当人为拔插电器、电器自动启停调频的时候,瞬时功率(电流)会发生波动 是正常现象。 但是当多个用电器叠加的时候即使没有拔插用电器,而且这些用电器也不具备自动调频、启停的功能。瞬时功率(电流)也会存在较大波动。针对这种异常现象,请回复: 这种异常现象是什么原因造成的,是否有类似降噪或者滤波等解决办法。来降低功率(电流)的异常波动。 注:瞬时功率(电流)波动指的是除了功率有效值之外还有功率分布也是不均匀的。
问题背景: 下图为同一电源类负载接入两种不同环境的电网中产生的电流波形图,电流信号 经由 2000:1 的电流互感器采样所得,数据值均已根据比例转换为以 A(安培)为单位,采 样率为 8533.33Hz,采样点共 342 点(两个工频周期),每条波形的起始点均对应该相电压 的过零点(由负到正)。 问题描述: 可以明显观察到两个浪涌的起始相位有很大的差异,经不完全测试,环境 1 的相 位为大部分电网接入该负载所呈现的相位,环境 2 的相位为少部分电网接入该负载所呈现 的相位。 1. 请从电力分析的角度解释为什么不同的电网环境会导致同一种负载的相位差 异? 2. 现具备电压电流同步采集的能力,是否有可能根据无负载时的数据自动检测 该环境存不存在相位偏移?如果可能,请说出具体检测标准。
c语言开发 1,定时截屏,并把图片转为压缩后的jpg格式。并把图片通过调用web API,传给后端。 2,调用API时,出了图片,还需要传入机器的id,该id配置在配置文件中 3,定时时间、api接口地址(相对地址),都在配置文件中。 4,具体配置格式如下: { "id_pc": "171-5", "device_interval":20, "server": { "server_url": "http://localhost/bendingDCI/" } } 5,因计算机系统比较老旧,所以采用c语音减低系统消耗,所以要求软件充分考虑内存、CPU低消耗。考虑内存回收问题,支持长时间运行不卡顿。 6、运行环境支持winXP系统,尽量用windows自动dll等。 7,记录必要文本日志,日志文件放在exe文件的log目下,每天记录一个新日志文件,日志名称:log20230905.txt。日志内容样例: 20230905 09:00:02 启动程序 20230905 09:01:08 执行任务成功 --这个意思就是上传成功,但不要直接写上传字样 8,开机自启动,启动后缩小多右下角图标,点击图标弹出窗口,窗口内容可以查看当天日志。 也可不带页面。 9,提供代码,包括运行环境、版本说明。 合作费用具体谈。
根据API接口提供的船名、航次信息从港航纵横以及其他船公司网站抓取预计离到港时间数据。 备注:港航纵横需要登录验证,有简单的英文+数字字母验证码。 其余船公司网站均不需要登录验证。 需要熟悉Python爬虫开发、能够调用验证码识别库进行验证码识别。
一、需求描述 根据项目分配得任务来完成工作 任务内容:企业内部系统,主要是做接口功能封装 二、人才要求 1、JAVA基础扎实,深入理解java集合、多线程、IO和JVM原理,精通常见的设计模式的使用场景; 2、熟练掌握 Spring、SpringMVC、SpringBoot、SpringCloud、Mybatis等框架,熟练掌握高并发、分布式、缓存、消息、异步等机制,有mq、Redis大型网站实战经验; 3、熟练掌握Mysql; 4、具备良好的编码习惯及严谨的逻辑思维,有一定的技术设计能力; 5、熟悉linux命令,能通过linux命令解决生产遇到的紧急问题; 6、责任心强,抗压能力强,工作积极主动,沟通协作能力较强; 7、3-6 年以上java开发经验,有企业内部系统开发经验。 三、其他要求 坐班要求:驻场开发。 项目周期:总周期约3-4个月。
一、需求描述 产品类别:FTP Server程序 开发进度:已有c++代码,需要调试 功能:实现FTP server常用功能,使用winSCP等工具可以正常登录、收发文件。 技术:使用c++语言,xp embedded嵌入式系统。注意不是纯xp。 人才要求 3年以上c++开发经验。 其他: 远程工作,时间预计半天。
需求:c#编制的FTP服务端程序,具有ftp常用功能: ①、按标准FTP协议登录FTP服务器,进行身份验证; ②、显示远程目录、文件列表,进行目录切换; ③、目录、文件列表的排序显示(文件名、时间、类型); ④、能上传文件、下载、删除文件; ⑤、支持设置选择二进制、文本格式文件传输(UNIX标准的文本);6、断点续传,文件大小限制。 要求产品稳定,自我容错,能长期运行不闪崩。 支持平台xp及以上系统,.net4。 参考产品 csdn很多开源类似产品。要鉴别功能,确保运行。 人才要求 c#3年以上 其它 远程工作,交付代码。 交付时间1天。
一、需求描述 产品类别:图像识别文字:数字带小数、英文、汉子。 功能:图像文字识别(可能是整数、小数、字符、汉字等)。 可以使用网上开源代码,但要提交能运行的完整代码。要能离线运行,使用免费第三方插件,无时间限制插件。 二、参考产品 opencv,百度离线ai等。 三、人才要求 精通c#,3年以上工作经验,做过类似工作。 四、其它 远程即可, 项目周期:1天
一、需求描述 产品类别:区块链 开发进度:已经有原型、UI图,开源程序需要后端技术开发。 功能:通过查看源码分析出需要数据结构,并封装成miner程序。 技术:熟悉erlang、nodejs框架,其他不限。 二、参考产品 三、人才要求 有对接矿池开发的经验,熟悉erlang语言,了解矿池协议,了解文件存储类token 四、其他要求 坐班要求:可以远程,每天远程会议1小时 项目周期:总周期约10天。
完善目前网站民宿预定平台功能,主要是实现会员等级制度,对应预定相应的折扣。 可参考携程等订房平台 对网站开发有经验,熟悉PHP语言 无坐班要求,网络沟通可以通畅即可 预期工期5天内完成,具体待沟通后确定
上海驻场项目,要求会shell或者python,按时间结算,项目做完为止。本科以上学历,三年以上工作经验。待遇从优。有意向的个人或者公司请和我联系。 用shell从服务器拿文件读取出来提供给接口。主要读取操作系统,nginx,tomcat等软件的配置文件。
一、需求描述 产品类别:电商 开发进度: 接口开发 技术:使用go、gin框架,其他不限。 二、参考产品 三、人才要求 3 年以上go开发经验,精通MySQL数据,有直播开发经验优先。 四、其他要求 坐班要求:远程,能及时反馈 项目周期:长期。
要求: 1、具有现金贷或场景贷等线上贷相关经验 2、Java工作年限大于5年 工作内容: 1、参与产品相关系统设计,负责所属模块的功能规划、需求分析设计、技术实现、调试与维护工作; 2、积极响应客户需求并进行开发和交付; 3、参与公司产品的架构优化,技术攻关,性能优化并辅助其他模块进行技术实现; 4、协助并完成其他各类技术开发任务,保障公司产品系统的稳定高效运行。
一、需求 在后台模拟app客户端进行下单 1. 下载美钢物流app体验一下 2. 主要业务流程: 1.代理同时登录20个账户 2.获取任务列表(开单前五分钟) 3. 选中意向任务,设置优先级(主要,非主要) 4.开单后提交,攻破或者绕过图片验证码 5.结束 注意点: 1.自动登录,ip、设备号等模拟,注意风控 2.验证码接口是否可绕过 .开始抢单到成功秒数得控制 2.ip不能一样 3.一个账号一个车次只抢一个单子 4. 多个账号同时运行抢单 ip一定不能重复 5. 延迟抢单秒数时间设置 二、参考火车票抢票(流程简化版:只需要登录、选订单、提交)
1、城市:上海 2、工作时间:周六日 3、后台语言java,3年以上的实际开发经验,较强的独立工作能力,熟悉数据库、后台开发、api接口开发,了解服务器运维等。 4、日薪制1000、项目制均可 5、偶尔需坐班。
有个h5要开发,设计我们自己做,你开发就行, 预算大概15万,大概需求如下 前端 0,微信授权登录 1,加载页 2,主界面,点亮指定图片,达到4个以后 3,本页面弹出宝盒 4,刮刮卡,刮奖品 5,中奖页(奖品和表单提交:姓名,手机号,收货地址) 7,未中奖页 后台 1,后台奖品管理(增删改),设置某奖品中奖概率,奖品数量, 显示字段:奖品图片,奖品名称,奖品中奖概率,奖品已中奖数量,奖品总数量 2,后台中奖记录(奖品信息,中奖时间,姓名,手机号,收货地址) 3,一个用户只有一次抽奖机会 微信:2076316064 兼职技术勿扰,商务勿加,客服勿扰,只接受公司或者全职技术或者团队
1、需求描述 教育行业招聘求职网站,用户可以注册后填写和管理简历。可以申请网站上发布的工作职位。产品后台具备完整的管理功能。 产品现需要1名或多名PHP开发,如果有整个开发团队最好。 2、参考产品 比较类似简单的招聘产品,可以理解为拉勾、猎聘的简化版。 3、人才要求 PHP实际项目编程经验,精通PHP与Mysql。有大型网站开发与应用研发经验; 熟练掌握HTML、JavaScript、CSS、XML、AJAX等知识; 良好的团队沟通能力,高度责任心与进取心,关注用户体验; 自由职业者或有大量空闲时间的开发者优先考虑。