新药开发是一个复杂而漫长的过程，从靶点发现到临床试验，往往需要数年甚至数十年的时间。而且，经过重重筛选和测试，最终能够成功上市的药物寥寥无几。近年来，人工智能和机器学习技术在各个领域取得了显著的进展，也为药物研发带来了新的希望。其中，生成对抗网络（GAN）在图像生成等领域表现出色，而将量子计算与 GAN 相结合，有望在药物发现中发挥更大的作用。

二、量子相关术语

（一）量子电路
量子电路是由一系列门组成的有序集合，用于改变量子比特的状态以执行特定的量子运算。

（二）量子噪声
量子噪声是指任何可能导致量子计算机出现故障的因素。当量子比特暴露于噪声源时，量子计算机中的信息会受到干扰和降级。

（三）量子 GAN
在量子 GAN 中，GAN 模型的生成器和判别器在量子计算机或设备上进行训练，这些设备能够轻松处理高维数据（即量子数据）。

Python用CNN – LSTM、ARIMA、Prophet股票价格预测的研究与分析

阅读文章 ➜

（四）带混合发生器的 Quantum GAN
QGAN-HG 由参数化量子电路组成，可提供量子比特大小维度的特征向量。需要一个经典的神经网络来生成所需的原子向量和键矩阵，以构建分子的图形表示，其中节点表示原子，边表示键。

三、QGAN量子电路

该电路在量子层的帮助下提供特征向量，其计算时间为 O（poly（log（M）））。量子层由初始化、参数化和测量三个阶段组成。在初始化部分，从 [-π, π] 中均匀采样两个参数 z1 和 z2，然后将其转换为数学形式，并对所有层重复操作，以生成酉矩阵 U（θ）。最后，通过对最终量子态应用量子运算来获取特征向量。图中提到的 Ry 和 Rz 是旋转门。

随时关注您喜欢的主题

四、QGAN-神经网络

从 QGAN电路生成特征向量后，这些向量被输入到经典神经网络中。此神经网络的输出包含原子层和键层，用于生成原子向量和键矩阵。

五、用于计算的指标

（一）Frechet 距离
它用于测量真实分子和合成分子分布之间的相似性。

（二）药物特性
药物性质包括药物可能性、溶解度、合成性等。这些特性与其他属性一起使用 RDKit 进行测量。

六、模型架构

如图所示：

第一张图片由药物片段和结合位点（受体）组成。药物的形状若适合受体，则有可能治愈疾病，这可以用锁和钥匙的概念来解释，受体如同锁，药物如同钥匙。
第二张图像由量子阶段和经典阶段组成，以虚线分隔。
第三张图片由原子和键矩阵组成，用于构建合成分子的图形结构。
在最后一步中，将真实分子和合成分子输入经典判别器以区分两者，并使用 RDKit 包评估 Frechet 距离和药物特性。最终预测将反馈到两个神经网络和量子电路，以便在每个训练周期更新所有参数。

七、用于训练模型的数据集

本研究使用的数据集由 134K 个稳定的有机小分子和多达 9 个重原子组成。

八、依赖

此模型依赖于以下框架：

python>=3.5
pytorch>=0.4.1

九、模型实现

（一）导入所需库和包
首先，导入所有必需的库和包，为后续的模型构建和训练做准备。

（二）设置量子比特单元并生成量子电路
初始化两个随机均匀噪声参数 z1 和 z2，然后为原子向量和节点矩阵生成一个电路。

以下是生成量子电路的代码及解释

 
# 这里 a 是邻接矩阵，x 是节点
mols, _, _, a, x, _, _, _, _ = self.data.next_train_batch(self.batch_size)
a = torch.from_numpy(a).to(self.device).long()  # 邻接矩阵。
x = torch.from_numpy(x).to(self.device).long()  # 节点。
# "将标签索引转换为独热向量
a_tensor = self.label2onehot(a, self.b_dim)
x_tensor = self.label2onehot(x, self.m_dim)
z = torch.stack(tuple(ibm_sample_list)).to(self.device).float()
 
# Z-to-target
#  计算假图像的损失。
edges_logits, nodes_logits = self.G(z)
# 用 Gumbel softmax 进行后处理
(edges_hat, nodes_hat) = self.postprocess((edges_logits, nodes_logits), self.post_method)
logits_fake, features_fake = self.D(edges_hat, None, nodes_hat)
g_loss_fake = - torch.mean(logits_fake)
 
# 计算真图像的损失
# 真实奖励
rewardR = torch.from_numpy(self.reward(mols)).to(self.device)
# 假图像奖励
(edges_hard, nodes_hard) = self.postprocess((edges_logits, nodes_logits), 'hard_gumbel')
edges_hard, nodes_hard = torch.max(edges_hard, -1)[1], torch.max(nodes_hard, -1)[1]
mols = [self.data.matrices2mol(n_.data.cpu().numpy(), e_.data.cpu().numpy(), strict=True)
        for e_, n_ in zip(edges_hard, nodes_hard)]
rewardF = torch.from_numpy(self.reward(mols)).to(self.device)
 
# 价值损失
value_logit_real,_ = self.V(a_tensor, None, x_tensor, torch.sigmoid)
value_logit_fake,_ = self.V(edges_hat, None, nodes_hat, torch.sigmoid)
g_loss_value = torch.mean((value_logit_real - rewardR) ** 2 + (
                        value_logit_fake - rewardF) ** 2)

这段代码主要进行模型的推理和损失计算。首先从数据集中获取训练批次的数据，然后对生成器和判别器的输出进行处理，计算真假图像的损失和价值损失，并通过 Frechet 距离计算键和原子的距离损失，最后将这些损失存储在一个字典中。

（五）分子评估
最后一步是通过 RDKit 评估所有分子，并输出评估结果。

结论

本文介绍了一种基于量子生成对抗网络的药物发现方法，通过量子电路和经典神经网络的结合，能够生成具有特定药物特性的分子。该方法在数据集上进行了训练和测试，取得了较好的结果。然而，该方法仍处于研究阶段，需要进一步的改进和优化。未来，可以通过增加数据集的规模、改进模型架构和优化算法等方式，提高模型的性能和泛化能力，为药物发现提供更有力的支持。