Open: Обработка конформационных ансамблей в Python

From TheorChemGroup at ZIOC RAS
Revision as of 18:14, 12 October 2022 by Admin (talk | contribs) (Николай Кривощапов обнаружил проблему с Венгерским алгоритмом, использующимся для сравнения конформеров в данной библиотеке, поэтому пока что для фильтрации конформеров предлагается использовать библиотеку Артёма Дмитриенко: Нахождение дубликатов структур.)

Николай Кривощапов обнаружил проблему с Венгерским алгоритмом, использующимся для сравнения конформеров в данной библиотеке, поэтому пока что для фильтрации конформеров предлагается использовать библиотеку Артёма Дмитриенко: Нахождение дубликатов структур.

В чем заключается эта обработка и для чего её делать?

Программы для конформационного поиска обычно выдают результаты в виде XYZ файлов, структуры из которых обычно надо вписать в инпут-файлы для последующей квантовохимической оптимизации. Чтобы уменьшить количество расчетов вам может захотеться сделать следующие операции, перед тем, как генерировать инпут-файлы:

  • Отсеять конформации с чрезмерно высокой энергией;
  • Удалить дубликаты;
  • Проверить сохранение констрейнов и отбросить структуры, в которых они нарушены. Например, когда вы ищите конформеры переходного состояния в CREST, полученный конформационный набор может содержать структуры, в которых заданные констрейны сильно нарушены. Если начнете оптимизировать такие геометрии в DFT, то ПС не найдется, а вы потратите время.
  • Проанализировать ансамбль и узнать, какие слабые взаимодействия (водородные связи и т.п.) могут образовываться в вашей молекуле. Найденные контакты можно учесть в дополнительных запусках конформационного поиска с констрейнами, чтобы лучше перебрать варианты с данными взаимодействиями.
  • Объединить конформационные ансамбли из нескольких расчетов, полученные, например, как в пункте выше, и отсортировать структуры по их энергии.

Этот мануал посвящен моей библиотеке pyxyz, которая позволяет решать эти задачи несколькими строчками в Python. Также этот мануал может быть полезен при анализе XYZ-файлов, полученных в результате расчета молекулярной динамики, оптимизаций, сканов, IRC и т.п.

Установка библиотеки

Для работы под Linux требуется Python версии 3.7 или выше. Для работы под Windows требуется Python версии 3.8 или выше. Из библиотек для Python будет нужен только Numpy. (Ещё, чтобы выполнить последнюю инструкцию этого мануала, нужен будет Pandas, но это не очень критично, он почти ни на что не влияет.)

Для установки на Linux нужно выполнить в терминале следующую команду:

pip install -i https://test.pypi.org/simple/ "pyxyz<1.0"

Для установки на Windows нужно выполнить в командной строке эту строчку:

pip install -i https://test.pypi.org/simple/ "pyxyz>=1.0"

Обратите внимание, что в некоторых случаях может понадобиться заменить pip на pip3 (это зависит от того, как у вас установлен Python).

После вызова pip install проверьте корректность установки: импортируется ли библиотека и выполняются ли тесты:

import pyxyz
import pyxyz.test
pyxyz.test.run_tests()

При импорте pyxyz под Linux может возникнуть ImportError, который исправляется изменением переменной LD_LIBRARY_PATH. Как это исправить библиотека пишет во время загрузки (строчка начинается с [WARNING]).

Ошибка выглядит так:

>>>  import pyxyz
[WARNING] In case you don't have gslcblas installed and get ImportError, call 'export LD_LIBRARY_PATH=/my/path/to/pyxyz:$LD_LIBRARY_PATH'
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/home/xray/.local/lib/python3.8/site-packages/pyxyz/__init__.py", line 10, in <module>
    from confpool import Confpool
ImportError: libgslcblas.so.0: cannot open shared object file: No such file or directory

То есть перед запуском python нужно выполнить эту строчку и ImportError исчезнет (/my/path/to/pyxyz надо заменить на то, что будет у вас):

 export LD_LIBRARY_PATH=/my/path/to/pyxyz:$LD_LIBRARY_PATH

Пример обработки набора конформаций

Архив с примерами -- Pyxyz_manual.zip (File:Pyxyz manual.zip)

В качестве примера рассмотрим конформационные наборы переходного состояния из файлов crest_conformersA.xyz и crest_conformersB.xyz (см. архив). Рассмотрим несколько учебных задач, которые могли бы возникнуть на практике. Обратите внимание, что в пределах одного объекта Confpool количество атомов в анализируемых молекулах и последовательность атомов в импортируемых xyz-файлах должны быть постоянными.

Для работы потребуются следующие импорты:

from pyxyz import Confpool
import numpy as np

Для большей интерактивности с библиотекой можно работать не только запуская код из файла, но и через jupyter notebook.

Рисунок 1. Геометрия ПС, для которого сделан конфпоиск

Базовая обработка конформационных наборов

Допустим, мы сделали два запуска CREST и получили два файла с конформациями crest_conformersA.xyz и crest_conformersB.xyz. Для начала, загружаем оба xyz-файла в один объект Confpool:

p = Confpool()
p.include_from_file("crest_conformersA.xyz")
p.include_from_file("crest_conformersB.xyz")
print("Loaded {} conformers".format(p.size))

Для дальнейшей обработки кроме геометрий нам понадобятся энергии конформеров, их можно извлечь из описания к структурам:

H2KC = 627.509474063 # Hartree to kcal/mol
KC2H = 1 / H2KC # Kcal/mol to hartree
n_del = 0
p["Energy"] = lambda m: float(m.descr.strip())
n_del += p.upper_cutoff("Energy", 5.0 * KC2H)
print("{} confs were filtered out".format(n_del))
p.sort("Energy") # Ascending by default. Use ascending=False to override

Четвертая строчка здесь самая интересная - в ней мы говорим, что каждой конформации нужно сопоставить ключ Energy и рассчитать его из описания к конформации с помощью переданной функции (strip удаляет ненужные пробелы, а float конвертирует в дробное число). Далее мы применям upper_cutoff, чтобы отбросить все конформеры с энергией выше 5 ккал/моль относительно минимальной энергии в наборе, и сортируем по возрастанию энергии. Стоит отметить, что все операции, сопровождающиеся удалением конформеров из набора (всего их четыре: filter, rmsd_filter, upper_cutoff, lower_cutoff), возвращают целое число - количество удаленных структур. Завершаем обработку отбрасыванием дубликатов по RMSD:

n_del += p.rmsd_filter(0.3)['DelCount']
print("{} confs were filtered in total".format(n_del))
p.descr = lambda m: "Conf #{}; Energy = {:6f} a.u.".format(m.idx + 1, m["Energy"])
p.save('basic_processing.xyz')

Здесь мы передали критерий для фильтрования RMSD < 0.3 A. Затем, для оставшихся уникальных конформеров обновили описание с помощью переданной lambda-функции и сохранили набор в файл. Чтобы получить более хорошее представление о том, какой RMSD cutoff стоит брать, вместе с вызовом rmsd_filter можно сделать следующее:

rmsd_res = p.rmsd_filter(0.3)
newp = Confpool()
newp.include_subset(p, [rmsd_res["MinRMSD_pairA"], rmsd_res["MinRMSD_pairB"]])
newp.save("rmsd_test.xyz")
print("The minimal accepted rmsd is {}".format(rmsd_res["MinRMSD"]))

Здесь создается ещё один набор с парой структур, соответствующих минимальному RMSD > rmsd_cutoff. Посмотрев, насколько сильно отличаются геометрии в файле rmsd_test.xyz можно попытаться оптимизировать rmsd_cutoff. Если почти не отличаются, то надо увеличивать. Слишком разные - уменьшать.

Получив финальных конформационный набор, можно не только сохранить его в xyz, а ещё и сгенерировать input-файлы для оптимизации или какого-то другого вида расчета:

gjftemplate = """\
%nprocs=24
# opt=(tight,maxcycle=300) freq=noraman def2tzvp empiricaldispersion=gd3bj rpbe1pbe scrf=(cpcm,solvent=water)

Conformation_{idx}

0 1
{xyz}


"""
for i in range(p.size):
    xyz = p[i].xyz # xyz is a Numpy matrix
    atom_symbols = p.atom_symbols
    xyzlines = []
    for j, symbol in enumerate(atom_symbols):
        xyzlines.append("%2s %14.6f %14.6f %14.6f" % (symbol, *xyz[j]))
    with open("conf_{}.gjf".format(i), 'w') as f:
        f.write(gjftemplate.format(xyz="\n".join(xyzlines), idx=i))

В 90% случаев, как мне кажется, на этом этапе потребности расчетчика должны уже быть удовлетворены. Но иногда может захотеться обработать структуры более детально.

Анализ геометрии

Продолжаем работу над объектом p, полученным в предыдущей секции. Как видно из рисунка 1, явная молекула воды была добавлена, чтобы стабилизировать атом водорода 26, но в ходе конфпоиска H2O могла перескочить на другие атомы. Чтобы понять, сколько структур содержат интересующую нас водородную связь H26-O27, можно выполнить следующий код:

p["H2O dist"] = lambda m: m.l(26, 27)
for i in range(p.size):
    print("Length = {}".format(p[i].l(26, 27)))
    # the same as 
    print("Length = {}".format(p[i]["H2O dist"]))
# Look at the printed numbers. And then
print("Found {} good structures".format(p.count(lambda m: m["H2O dist"] < 1.8)))

Мы здесь использовали функцию m.l(a, b), чтобы обратиться к длинам связи отдельной структуры в наборе (внутри lambda-функции и при обращении по индексу). И ещё пригодилась функция count, чтобы посчитать количество структур, удовлетворяющих заданному условию. Небольшое отступление: удобством в обращении по ключу в цикле, т.е. p[i]["H2O dist"], является возможность поменять значение ключа только для i-ой структуры: p[i]["H2O dist"] = 123.0; но в текущей задаче это не понадобилось.

Далее можно отобразить наличие нужно водородной связи в описании структуры:

def quality_check(m):
    if m["H2O dist"] < 1.8:
        comment = "Nice"
    else:
        comment = "Garbage"
    return "{}; E={:3f} a.u.".format(comment, m["Energy"])

# Print new descriptions in the console
for i in range(p.size):
    print(quality_check(p[i]))

p.descr = quality_check # Set new descriptions
p.save('check.xyz') # Now show this file to your supervisor

Если нужно наложить какие-то сложные требования на геометрию, то это можно сделать в одну строчку. Валентные и торсионные углы вычисляются функциями m.v(a, b, c) и m.z(a, b, c, d), соответственно:

hbond_condition = lambda m: m.l(25, 10) < 2.0 and m.v(24, 25, 10) > 150.0 and abs(m.z(26, 23, 24, 25)) > 120.0
print("There are {} matches".format(p.count(hbond_condition)))
p.filter(hbond_condition)

min_ener = min(p["Energy"]) # p["Energy"] creates a list of floats
p["E.Rel"] = lambda m: H2KC * (m["Energy"] - min_ener)
p.descr = lambda m: "{}; E(rel.)={:3f} kcal/mol".format(m.descr, m["E.Rel"])
p.save('check.xyz')

Не считая сложного условия hbond_condition, в части с фильтрованием всё очевидно. А вот во второй части кода есть особенности: обращением p["Energy"] можно получать лист значений некого существующего ключа, а при установке новых значений p.descr или p["Some key"] можно обращаться к их старым значениям.

Тонкости работы с библиотекой

Как вы уже могли заметить, библиотека сделана исходя из нескольких ограничений:

  1. Все структуры подаются с одинаковой нумерацией атомов. Если дать две структуры с нумерациями C1, H2, H3 и H1, C2, H3, то будет исключение.
  2. Кроме XYZ, каждой структуре сопоставляется одна строка m.descr и сколько угодно дробных чисел m["SomeKey"], к которым можно обращаться по ключу (ключами могут быть только строки). Попытка записать по ключу что-то кроме дробного числа приведет к исключению (аналогично, с нестрочными описаниями структур).
  3. Все структуры имеют одинаковый набор ключей.

Вернемся к задаче с переходным состоянием с Рисунка 1 и допустим, что мы хотим проанализировать, насколько энергетически выгодны конформации, заданные критерием hbond_condition(m) and m.l(26, 27) < 1.8, на фоне остальных найденных конформаций.

import pandas as pd
p = Confpool()
p.include_from_file("crest_conformersA.xyz")
p.include_from_file("crest_conformersB.xyz")
p["Energy"] = lambda m: float(m.descr.strip())
p.sort("Energy")
p.rmsd_filter(0.3)
for i in range(p.size):
    if hbond_condition(p[i]) and p[i].l(26, 27) < 1.8:
        p[i]["MyCondition"] = 1.0
    else:
        p[i]["MyCondition"] = 0.0
print(pd.DataFrame(p.as_table()))

В результате мы получили DataFrame, в котором MyCondition соответствует тому, выполняются наши требования на водородные связи или нет:

    MyCondition     Energy
0           0.0 -45.344433
1           0.0 -45.343703
2           1.0 -45.343607
3           0.0 -45.343443
4           0.0 -45.342388
5           1.0 -45.342137
...

Здесь, мы пользуемся небольшим костылём в связи с тем, что ключи обязаны быть дробными числами, поэтому "MyCondition" - дробное число, а не bool, например. Чтобы об этом не забывать, никакие неявные конверсии во время присвоения не делаются (см. выше, что с 1.0 работает, а с 1 - нет). Другой момент - это что присвоение значения нового ключа для одной структуры автоматически инициализирует этот ключ со значением 0.0 для всех остальных структур (см. третий принцип в начале раздела). Ну и, наконец, p.as_table() генерирует вам данные всех ключей в виде словаря из листов.

Ещё добавлю, что можно достаточно легко удалять ненужные структуры и ключи:

del p[0]
del p[p.size - 1]
del p["MyKey"]

Этот код удаляет первую и последнюю структуры в наборе, а затем удаляет ключ "MyKey" для всех оставшихся структур.

Для особо заинтересовавшихся в следующем разделе приведен весь функционал библиотеки.

Подробное описание функционала библиотеки

В библиотеке определяется два класса: Confpool (всё, что мы в предыдущем разделе обозначали p) и MolProxy (всё, что мы в предыдущем разделе обозначали m). Объекты MolProxy привязаны к определенному индексу в конкретном объекте Confpool.

Описание методов классов Confpool приведено по следующей схеме:

Имя функции(название аргумента: тип аргумента, ...) -> тип возвращаемого значения

Во всех примерах объект Confpool имеет название p, а объект MolProxy - m. То есть они создавались строчками:

# Confpools are created only by user
p = Confpool()

# MolProxies are accessed via __getitem__(int)
m = p[0]

# MolProxies are also used in functions filter, count, __setitem__(key name, some function) and __setattr__("descr", some function)
p.filter(lambda m: m.l(1, 2) > 2.0)
p["E.Rel"] = lambda m: H2KC * (m["Energy"] - min_ener)
p.descr = lambda m: "E(rel.)={:3f} kcal/mol".format(m["E.Rel"])

Если вам неочевидно, что такое __setitem__ и __setattr__, советую посмотреть эту таблицу.

Класс Confpool

Добавление структур в набор

include_from_file(filename: str) -> None
Загрузка структур из XYZ-файле filename.
filename - имя xyz-файла для импорта.
 
Пример, когда в описании к структуре энергия дается, как число без дополнительных подписей:
p.include_from_file("file.xyz")

Изменение данных

sort(keyname: str, ascending = True) -> None
Сортировка ансамбля по возрастанию значения ключа. ascending - опциональный keyword (по-умолчанию True).
Пример: e.sort("Energy") или e.sort("BondLength", ascending = False)
filter(f: function) -> int, f(m: MolProxy) -> bool
Удаление из набора структур, для которых функция f возвращает false. Возвращаемое значение - количество удаленных из набора структур.
Пример: ...
rmsd_filter(cutoff: float) -> int
Удаление дубликатов по RMSD с учетом симметрии (hungarian algorithm). cutoff - пороговое значение RMSD, ниже которого одна из структур будет удалена. Возвращаемое значение - количество удаленных из набора структур.
Пример: ...
upper_cutoff(key: str, cutoff: float) -> int
Удаление из набора структур, для которых значение ключа key выше минимального по набору значения более чем на cutoff. Возвращаемое значение - количество удаленных из набора структур.
Пример: ...
lower_cutoff(key: str, cutoff: float) -> int
Удаление из набора структур, для которых значение ключа key выше ниже максимального по набору значения более чем на cutoff. Возвращаемое значение - количество удаленных из набора структур.
Пример: ...

Методы без изменения данных

count(f: function) -> int, f(m: MolProxy) -> bool
Подсчет количества структур в наборе, для которых функция f возвращает true.
Пример: ...
save(filename: str) -> None
Сохранение структур и их описаний в файл filename. Порядок структур в файле соответствует их последовательности в объекте Confpool.
Пример: ...
as_table() -> dict
Генерация словаря, ключи которого точно такие же, как и ключи структур в объекте Confpool. Каждому ключи в словаре сопоставлен лист из дробных чисел - значений ключа для i-ой структуры набора.
Пример: ...

Magic methods

__getitem__(arg: int/str) -> MolProxy/list
Получение данных через [...]. Если в квадратных скобках int, то возвращается MolProxy молекулы с данных индексом. Если в квадратных скобках str, то возвращается лист значений ключа arg.
Пример: ...
__setitem__(key: str, value: function) -> None, value(m: MolProxy) -> float
Создание/изменение значений ключа key через [...]. Справа от знака = передается функция, которая рассчитывает из MolProxy новое значение ключа. В функции value разрешается обращение к старому значению ключа.
Пример: ...
__getattr__(attr: str) -> int (if attr == "size") or list of str (if attr == "atom_symbols")
Получение атрибута через точку (p.attr). Если attr == "size", возвращается количество структур в наборе, а если attr == "atom_symbols" - лист из обозначений атомов ("C", "Na" и т.п.)
Пример: print("{} structures in the pool".format(p.size))
__setattr__(attr: str, value: function) -> None, value(m: MolProxy) -> str
Изменение атрибута через точку (p.attr). Можно использовать для установки описания структур (p.descr = ...), другого использование __setattr__ не имеет. Справа от знака = передается функция, которая генерирует из MolProxy новое описание молекулы. В функции value разрешается обращение к старому описанию молекулы.
Пример: ...
__delitem__(key: int/str) -> None
Удаление через "del p[key]". Если key имеет тип int, то удаляется структура с индексом key. Если key имеет тип str, то из набора удаляется ключ key.
Пример: del p[0] или del p["BondLength"]

Класс MolProxy

Геометрические данные

l(a: int, b: int) -> float
Расчет длины связи между атомами с индексами a и b. Нумерация атомов начинается с 1.
Пример: m.l(1, 2)
v(a: int, b: int, c: int) -> float
Расчет валентного угла для тройки атомов с индексами a, b и c. Нумерация атомов начинается с 1.
Пример: m.v(1, 2, 3)
z(a: int, b: int, c: int, d: int) -> float
Расчет торсионного угла для четверки атомов с индексами a, b, c и d. Нумерация атомов начинается с 1.
Пример: m.z(1, 2, 3, 4)

Magic methods

__getitem__(key: str) -> float
Получить значение ключа через [key].
Пример: m["Energy"]
__setitem__(key: str, value: float) -> None
Установить значение ключа через [key] = .... Справа от знака = передается дробное число - новое значение ключа. Если ключа key не существует, то он будет создан нулевым для всех остальных структур в наборе.
Пример: n["Energy"] = -1.0
__getattr__(attr: str) -> np.ndarray (if attr == "xyz") or str (if attr == "descr") or int (if attr == "idx")
Получение атрибута через точку (p.attr). Если attr == "xyz", возвращается матрица координат Nx3. Если attr == "descr", - описание структуры. Если attr == "idx", - индекс структуры в наборе, на которую ссылается данный объект MolProxy.
Пример: print(m.descr), index = m.idx и т.п.
__setattr__(attr: str, value: str) -> None
Изменение атрибута через точку (p.attr). Можно использовать для установки описания структур (m.descr = ...), другого использование __setattr__ не имеет. Справа от знака = передается новое описание.
Пример: m.descr = "New description"

Сборка pyxyz из исходного кода

Этот раздел может быть полезным (1) если вы хотите добавить в pyxyz новую функцию или нашли баг, (2) если вам нужно собрать библиотеку под новую версию Python или под нестандартную операционную систему, (3) хотите научиться делать Python-модули с помощью pybind11/C++.

При загрузке на pyxyz на pypi мной используется немного странное соглашение о версии библиотеки: a.b.c, где а - это 1 (версия под Windows) или 0 (версия под Linux), b - обозначение версии Python (37, 38, 39 или 310), c - собственно версия кода библиотеки. Например, pyxyz версии 1.310.3 собирается для работы под Windows на Python 3.10 (и номер ревизии кода = 3). Когда хотите загрузить на pypi новую ревизию кода, увеличивайте номер ревизии (c) в файле setup.py (директории release_files и setup.py):

version='1.3{ver}.1', # здесь версия равна 1 (правая единица)

Сборка под Linux проверена на GCC 10.3.1, а под Windows - на GCC 12.1.0.

Сборка под Linux

Пререквизиты: make, cmake, g++, gsl, boost, pkg-config. Чтобы собрать библиотеку на одном компьютере без цели её распространения (для выполнения конкретной задачи или в процессе разработки), выполните следующее:

git clone --recurse-submodules https://gitlab.com/knvvv/pyxyz.git
cd pyxyz
python build_script.py 8 # Восьмерка соответствует x в версии Python3.x (может быть 8, 9 или 10)
cd release
pip install .

Готово!

Если стоит задача загрузить библиотеку на pypi, то понадобится ещё и conda, в которой должны быть созданы отдельные среды с разными версиями Python:

conda create -n py38 python=3.8 -y
conda activate py38
pip install numpy twine
conda deactivate
# Повторить для Python3.x (x = 7, 9, 10)

Таким образом, должно быть создано четыре среды: py37, py38, py39 и py310. Далее скачиваем исходный код:

git clone --recurse-submodules https://gitlab.com/knvvv/pyxyz.git
cd pyxyz

Затем для каждой версии Python выполняем сборку библиотеки и загружаем соответствующую версию на pypi:

conda activate py38
python build_script.py 8 # Восьмерка соответствует x в версии Python3.x
cd release
python setup.py sdist
twine upload --repository testpypi dist/* # Ввести логин и пароль
conda deactivate

Повторите тоже самое для остальных версий Python.

После запусков twine вам будет выписываться ссылка типа https://test.pypi.org/project/pyxyz/0.310.3/, по которой можно будет посмотреть команду для скачивания только что собранной версии. Более того, по аналогии с

pip install -i https://test.pypi.org/simple/ "pyxyz<1.0"

можно написать универсальную команду, чтобы устанавливать независимо от версии Python.

Сборка под Windows

Установите себе MSYS2 по ссылке (там надо нажать на 32-bit или 64-bit, а потом скачать свежий exe-шник msys2-x86_64-???.exe). После установки запустите через Пуск терминал MSYS2 MinGW x64 и установите некоторые пререквизиты:

pacman -Syu
pacman -S --needed base-devel mingw-w64-x86_64-toolchain
pacman -S mingw-w64-x86_64-gsl mingw-w64-x86_64-boost mingw-w64-x86_64-cmake mingw-w64-x86_64-pybind11 git

Стоит отметить, что MSYS2 и установленные только что библиотеки нужны только для сборки pyxyz под Windows, но не требуются для его использования.

Также нужно, чтобы у вас была установлена Anaconda (или Miniconda). Узнайте расположение файла conda.exe и добавьте в файл C:\msys64\home\*myusername*\.bash_profile следующую строчку:

eval "$('/c/tools/Anaconda3/Scripts/conda.exe' 'shell.bash' 'hook')"
# Проверьте путь к conda.exe!

Как и в Linux может быть два варианта сборки: только для своего компьютера и для загрузки на pypi. Инструкции для своего компьютера:

git clone --recurse-submodules https://gitlab.com/knvvv/pyxyz.git
cd pyxyz
python winbuild_script.py 8 # Восьмерка соответствует x в версии Python3.x (может быть 8, 9 или 10)
cd release
pip install .

Готово! Теперь даже из командной строки Anaconda (вне MSYS2) можно будет вызывать pyxyz.

Как и c линуксом, если стоит задача загрузить библиотеку на pypi, то понадобится создать отдельные среды в conda с разными версиями Python:

conda create -n py38 python=3.8 -y
conda activate py38
pip install numpy twine
conda deactivate
# Повторить для Python3.x (x = 9, 10)

Таким образом, должно быть создано три среды: py38, py39 и py310. Далее скачиваем исходный код:

git clone --recurse-submodules https://gitlab.com/knvvv/pyxyz.git
cd pyxyz

Затем для каждой версии Python выполняем сборку библиотеки и загружаем соответствующую версию на pypi. Шаги по загрузке на pypi делаются не в MSYS2, а в обычной командной строке Anaconda, потому что MSYS2 зависает на стадии ввода пароля при загрузке через twine.

conda activate py38
python winbuild_script.py 8 # Восьмерка соответствует x в версии Python3.x
conda deactivate
# В отдельном окне командной строки Anaconda (уже не MSYS2):
conda activate py38
cd *mypath*/pyxyz/release
python setup.py sdist
twine upload --repository testpypi dist/* # Ввести логин и пароль
conda deactivate

Повторяем эти шаги для версий Python 3.9 и 3.10. Универсальная ссылка на скачивание под Windows делается по следующему принципу:

pip install -i https://test.pypi.org/simple/ "pyxyz>=1.0"

TODO

  1. Вариация класса Confpool для произвольных структур без ограничений на типы атомов
  2. Вариации класса Confpool с ключами произвольного (mutable) типа и значениями типа py::object.
  3. Build connectivity graphs & search for VdW contacts
  4. copy constructor, operator+
  5. Прикрутить библиотеку, которая парсит логи квантовохимических программ
  6. __version__

Зеркальные отражения