【名家案例】連續(xù)流工藝優(yōu)化中的機(jī)器學(xué)習(xí)和人工智能

更新時(shí)間：2024-08-07 點(diǎn)擊次數(shù)：503

研究背景

近年來(lái)，對(duì)有機(jī)反應(yīng)工藝的自主優(yōu)化以及反應(yīng)結(jié)果的大數(shù)據(jù)集的生成或使用都受到了重大關(guān)注。然而，對(duì)于反應(yīng)優(yōu)化仍然沒有明確的“最佳方法"。

2021年，Astex制藥公司和劍橋大學(xué)的合作研究，最大限度地將預(yù)先存在的數(shù)據(jù)和自我優(yōu)化算法結(jié)合在一起，發(fā)表了多任務(wù)優(yōu)化算法（多任務(wù)貝葉斯優(yōu)化，MTBO）。MTBO被視為“小數(shù)據(jù)"反應(yīng)優(yōu)化的最佳算法模型，當(dāng)時(shí)該模型僅使用計(jì)算機(jī)模擬示例進(jìn)行了演示。

圖1. 使用已有數(shù)據(jù)在流動(dòng)反應(yīng)器中進(jìn)行自我優(yōu)化

歐洲連續(xù)流大咖，格拉茨大學(xué)連續(xù)流合成中心（CC FLOW）和制藥研究中心工程股份有限公司（RCPE）的C.Oliver Kappe教授，用于真正的合成化學(xué)優(yōu)化問題，在實(shí)驗(yàn)室中驗(yàn)證了該方法。如（圖1）。

【名家案例】連續(xù)流工藝優(yōu)化中的機(jī)器學(xué)習(xí)和人工智能

流動(dòng)化學(xué)反應(yīng)器通常用于一些危險(xiǎn)化學(xué)反應(yīng)的高傳質(zhì)、傳熱和批量穩(wěn)定生產(chǎn)的需求，但它也能為科學(xué)研究提供平臺(tái)。與傳統(tǒng)方法相比，流動(dòng)反應(yīng)器較少的反應(yīng)物料、快速篩選反應(yīng)條件有其優(yōu)勢(shì)。

流動(dòng)反應(yīng)平臺(tái)，可以對(duì)每個(gè)單獨(dú)的實(shí)驗(yàn)條件進(jìn)行設(shè)置，并且可實(shí)現(xiàn)自動(dòng)化。使用液體處理器制備反應(yīng)混合物也能夠在優(yōu)化分類變量（例如，溶劑和配體）得到充分的研究。這是標(biāo)準(zhǔn)優(yōu)化方法非常難以處理的考量因素。

【名家案例】連續(xù)流工藝優(yōu)化中的機(jī)器學(xué)習(xí)和人工智能

事實(shí)上，如果能使用現(xiàn)有的數(shù)據(jù)，例如開放Zenodo（由歐洲核子研究中心運(yùn)作）反應(yīng)數(shù)據(jù)庫(kù)和存儲(chǔ)庫(kù)，計(jì)算機(jī)模擬就能實(shí)現(xiàn)這個(gè)目標(biāo)。

本文作者首先利用公開的Suzuki偶合和Buchwald-Hartwig數(shù)據(jù)集，進(jìn)行了計(jì)算機(jī)模擬演示，然后進(jìn)行實(shí)驗(yàn)優(yōu)化演示。

在計(jì)算機(jī)模擬的優(yōu)化中，一個(gè)關(guān)鍵的發(fā)現(xiàn)是當(dāng)存在多種不同的底物時(shí)就會(huì)生產(chǎn)更大的輔助數(shù)據(jù)集，MTBO算法似乎在更大的輔助數(shù)據(jù)集中運(yùn)行得更好。這在Suzuki偶合案例中得到了很好的運(yùn)用，當(dāng)所有四個(gè)可用的數(shù)據(jù)集都用于輔助任務(wù)時(shí)，它提供了最佳的性能。

一般來(lái)說，人們會(huì)假設(shè)可用的數(shù)據(jù)越多，優(yōu)化的效率就越高。因此，這自然而然地反映了一個(gè)科學(xué)家，尤其是工業(yè)界科學(xué)家多年來(lái)一直在努力解決的問題：我們?nèi)绾斡行У赜涗浐屠眠^去實(shí)驗(yàn)的結(jié)果？阿斯利康、圣母大學(xué)和麻省理工學(xué)院的科學(xué)家最近發(fā)表的一篇論文也討論了這個(gè)問題，特別是關(guān)于電子實(shí)驗(yàn)室筆記本（ELN），并確保包括負(fù)面數(shù)據(jù)也得到有效的使用。這將為未來(lái)的機(jī)器學(xué)習(xí)和人工智能提供有力的支持。

【名家案例】連續(xù)流工藝優(yōu)化中的機(jī)器學(xué)習(xí)和人工智能

圖2. 數(shù)據(jù)量的增加每個(gè)底物的優(yōu)化時(shí)間相應(yīng)減少

實(shí)驗(yàn)室演示的C-H活化反應(yīng)在含有較高比例極性官能團(tuán)的小片段上進(jìn)行，這是常用的合成方法，意義重大。對(duì)于藥物發(fā)現(xiàn)中的目標(biāo)分子很適用。

盡管對(duì)不同反應(yīng)性的底物來(lái)說，數(shù)據(jù)收集并不容易，但每個(gè)底物的輔助數(shù)據(jù)集的增長(zhǎng)使優(yōu)化速率提升。訪問常用已公開的反應(yīng)類型的實(shí)時(shí)數(shù)據(jù)集，可以減少對(duì)特定底物對(duì)實(shí)驗(yàn)的依賴，快速得到最佳工藝條件，為研究組帶來(lái)巨大優(yōu)勢(shì)。

【名家案例】連續(xù)流工藝優(yōu)化中的機(jī)器學(xué)習(xí)和人工智能

MTBO現(xiàn)已可供他人使用，但還在不斷改進(jìn)之中，不久我們將看到它巨大的潛力。改進(jìn)包括，但不限于：

使用液滴流反應(yīng)器等改進(jìn)，以減少催化劑和原材料的消耗；
變量范疇的表示，目前是通過簡(jiǎn)單地分配“1"和“0"對(duì)應(yīng)于每個(gè)分類變量（稱為一個(gè)熱變量編碼、OHE）。其他選項(xiàng)，如主成分分析（PCA），可能有助于包括有關(guān)這些分類變量屬性的信息；
反應(yīng)物的描述符也可以用來(lái)優(yōu)先考慮在輔助任務(wù)數(shù)據(jù)集中最相似反應(yīng)伙伴的數(shù)據(jù)。
隨著反應(yīng)優(yōu)化從經(jīng)典方法演變，有機(jī)化學(xué)家將繼續(xù)看到新的有效選項(xiàng)被添加到他們的優(yōu)化工具箱中，使得該工具更加被廣泛使用。

【名家案例】連續(xù)流工藝優(yōu)化中的機(jī)器學(xué)習(xí)和人工智能

隨著自優(yōu)化的連續(xù)流反應(yīng)器頻繁使用，利用先前的知識(shí)和數(shù)據(jù)（例如以前的試驗(yàn)記錄結(jié)果），結(jié)合機(jī)器學(xué)習(xí)和人工智能來(lái)加快反應(yīng)過程的優(yōu)化，這已成為一個(gè)重要的研究方向。
自優(yōu)化流動(dòng)反應(yīng)器的高效率可以通過利用預(yù)先存在的多任務(wù)貝葉斯優(yōu)化方法中的反應(yīng)數(shù)據(jù)。
本文就是選取了Suzuki偶合和Buchwald-Hartwig實(shí)驗(yàn)數(shù)據(jù)來(lái)進(jìn)行計(jì)算機(jī)模擬演示，這些結(jié)果可以指導(dǎo)像MTBO（多任務(wù)貝葉斯優(yōu)化）這樣的算法進(jìn)行有效的實(shí)驗(yàn)優(yōu)化演示。

什么是多任務(wù)貝葉斯優(yōu)化？

多任務(wù)貝葉斯優(yōu)化是一種優(yōu)化算法，主要應(yīng)用于機(jī)器學(xué)習(xí)和人工智能領(lǐng)域。它是一種基于貝葉斯統(tǒng)計(jì)的優(yōu)化方法，通過同時(shí)考慮多個(gè)目標(biāo)或任務(wù)，來(lái)找到優(yōu)解。這種方法能夠有效地處理多目標(biāo)優(yōu)化問題，特別是在目標(biāo)之間存在一定的相關(guān)性時(shí)，可以大大提高優(yōu)化的效率和準(zhǔn)確性。

【名家案例】連續(xù)流工藝優(yōu)化中的機(jī)器學(xué)習(xí)和人工智能

參考文獻(xiàn)：ACS Cent. Sci. 2023, 9, 864?866

亚洲丝袜诱惑一区二区三区|中文字幕网精品一区二区不卡|天天免费看高清在线视频不卡|人妇乱系列中文字幕人妻

【名家案例】連續(xù)流工藝優(yōu)化中的機(jī)器學(xué)習(xí)和人工智能