天池学习

💪朝着抵抗力最大的路径走-Rank16-强化学习、黑盒攻击、Baseline-SecurityAIRound4

0
0
0
文章

0


全部评论(8)
  • https://github.com/IvanaXu/TianChiProj/blob/master/2020.09-2.SecurityAI_Round4

    8楼0回复发表于北京市
  • +1

    7楼0回复发表于北京市
  • lrModel = linear_model.RidgeCV(alphas=alphas_to_test, store_cv_values=True) ??? 

    6楼0回复
  • https://kexue.fm/archives/7737

    5楼1回复
  • [good]

    4楼1回复
    2020-09-06 09:55:18
    circle法类似,没想到会是一个用于攻击的baseline
    0回复
  • 推荐学习链接

    3楼0回复
  • 先赞再评,个人感觉强化学习跟有监督学习相比,只是sample收集机制不同,能够边学边收集

    2楼0回复
    2020-09-03 21:34:03
    差不多,但不甚具体。 本质差异在于: 【1】强化学习数据更序列化且是需反馈; 【2】强化学习target是估计所得; 【3】强化学习强调过程化,更有生命; 引用周志华《机器学习》 “但不同的是,在强化学习中并没有监督学习中的有标记的样本,换言之,没有人直接告诉机器在什么状态下应该做什么动作,只有等到最终结果揭晓,才能通过‘反思’之前的动作是否正确来进行学习,因此,强化学习在某种意义上可看作具有‘延迟标记信息’的监督学习问题”
    3回复
  • 1楼0回复