招聘職位:Python/大語言模型實習(xí)生
1.工作地點:北京
2.招聘人數(shù):2人
3.實習(xí)周期:3個月及以上(長期優(yōu)先)
4.工作時間:每周至少4天
崗位職責(zé)
1.參與基于Python的數(shù)據(jù)采集系統(tǒng)開發(fā),實現(xiàn)多源數(shù)據(jù)自動化獲取
2.運用OCR技術(shù)(PaddleOCR/Tesserac/olmOCR等)處理各類文檔與圖像數(shù)據(jù)
3.開發(fā)基于大模型(LLM)的文檔理解與信息抽取功能
4.參與構(gòu)建RAG(檢索增強生成)系統(tǒng),優(yōu)化文檔問答效果
5.協(xié)助完成數(shù)據(jù)處理pipeline的設(shè)計與優(yōu)化
任職要求
1.計算機/人工智能相關(guān)專業(yè)在校生
2.扎實的Python編程能力
3.熟悉常用數(shù)據(jù)結(jié)構(gòu)與算法
4.熟悉Scrapy/Requests等爬蟲框架
5.掌握OpenCV/Pillow等圖像處理庫
6.了解PyPDF2/pdfplumber等文檔解析工具
7.有使用deepseek/文心一言等大模型API的經(jīng)驗
8.具備大模型訓(xùn)練基礎(chǔ),了解Transformer架構(gòu)原理,有使用PyTorch進(jìn)行模型微調(diào)(如LoRA/P-tuning)或分布式訓(xùn)練的實際經(jīng)驗
加分項
1.有實際數(shù)據(jù)采集項目經(jīng)驗
2.參與過文檔識別相關(guān)開發(fā)
3.了解LangChain等LLM應(yīng)用框架
4.熟悉Docker基本使用
簡歷請發(fā)至:lvyk@cnis.ac.cn(郵件標(biāo)題格式:姓名+年齡+學(xué)歷+應(yīng)聘職位名稱)
招聘職位:Python/大語言模型實習(xí)生
1.工作地點:北京
2.招聘人數(shù):2人
3.實習(xí)周期:3個月及以上(長期優(yōu)先)
4.工作時間:每周至少4天
崗位職責(zé)
1.參與基于Python的數(shù)據(jù)采集系統(tǒng)開發(fā),實現(xiàn)多源數(shù)據(jù)自動化獲取
2.運用OCR技術(shù)(PaddleOCR/Tesserac/olmOCR等)處理各類文檔與圖像數(shù)據(jù)
3.開發(fā)基于大模型(LLM)的文檔理解與信息抽取功能
4.參與構(gòu)建RAG(檢索增強生成)系統(tǒng),優(yōu)化文檔問答效果
5.協(xié)助完成數(shù)據(jù)處理pipeline的設(shè)計與優(yōu)化
任職要求
1.計算機/人工智能相關(guān)專業(yè)在校生
2.扎實的Python編程能力
3.熟悉常用數(shù)據(jù)結(jié)構(gòu)與算法
4.熟悉Scrapy/Requests等爬蟲框架
5.掌握OpenCV/Pillow等圖像處理庫
6.了解PyPDF2/pdfplumber等文檔解析工具
7.有使用deepseek/文心一言等大模型API的經(jīng)驗
8.具備大模型訓(xùn)練基礎(chǔ),了解Transformer架構(gòu)原理,有使用PyTorch進(jìn)行模型微調(diào)(如LoRA/P-tuning)或分布式訓(xùn)練的實際經(jīng)驗
加分項
1.有實際數(shù)據(jù)采集項目經(jīng)驗
2.參與過文檔識別相關(guān)開發(fā)
3.了解LangChain等LLM應(yīng)用框架
4.熟悉Docker基本使用
簡歷請發(fā)至:lvyk@cnis.ac.cn(郵件標(biāo)題格式:姓名+年齡+學(xué)歷+應(yīng)聘職位名稱)