merve (@mervenoyann)
OpenEnv를 비전-언어 모델(VLM)으로 확장하는 실험 기록. 이미지를 그리드로 렌더링해 base64 관측으로 전달하는 스네이크(snake) 환경을 만들어 VLM이 이미지 관측을 처리하도록 했고, 소규모(3 에피소드) 리플레이를 시연했다는 개발 노트.
merve (@mervenoyann)
OpenEnv를 비전-언어 모델(VLM)으로 확장하는 실험 기록. 이미지를 그리드로 렌더링해 base64 관측으로 전달하는 스네이크(snake) 환경을 만들어 VLM이 이미지 관측을 처리하도록 했고, 소규모(3 에피소드) 리플레이를 시연했다는 개발 노트.
Tôi đã tạo một mô hình chơi Wordle bằng cách tinh chỉnh GRPO + TRL + OpenEnv trên Colab! Mô hình này sử dụng học tăng cường và môi trường OpenEnv. #Wordle #TRL #OpenEnv #GRPO #HọcTăngCường #MôHìnhHọcMáy #Colab #ReinforcementLearning #AI
https://www.reddit.com/r/LocalLLaMA/comments/1p5d3j6/i_finetuned_a_model_with_grpo_trl_openenv/
Envie: Công cụ mã nguồn mở thay thế .env, giúp quản lý biến môi trường, API keys và các bí mật dự án một cách an toàn và dễ dàng hơn. Dễ dàng chuyển đổi giữa các môi trường development, staging và production.
#opensource #congnghe #devops #openenv #manguonmo
https://www.reddit.com/r/SideProject/comments/1n6dzbc/i_built_envie_an_open_source_tool_designed_to/