我正在开发一个应用程序,我在其中迭代表中的许多(1,000,000+)行,同时插入新行并沿途更新现有行.要求select语句产生表中的每一行(最初执行select时存在的那一行)恰好一次,并且永远不会产生在执行select之后插入的行.我宁愿不将所有行加载到内存中(这需要很长时间和大量RAM - 我尝试过).
我已经开发了一个小的Python示例,它演示了SQLite显然不会从长时间运行的选择中隔离插入(并且可能是更新和删除).我无法在SQLite文档中找到任何特别提到这种行为的地方,但是我发现了一些链接,这些链接暗示了插入失败的事实(可能在早期版本的SQLite中?),这在我的例子中没有.
import sqlite3
def select_affected_by_insert():
# select from and simultaneously modify same table
cn = sqlite3.connect(':memory:')
cn.execute("CREATE TABLE demo (v INTEGER PRIMARY KEY)")
n = 5
values = [[v] for v in range(n)]
cn.executemany('INSERT INTO demo VALUES (?)', values)
for (v,) in cn.execute('SELECT v FROM demo'):
with cn:
# insert in transaction
cn.execute('INSERT INTO demo VALUES (?)', [n + v])
print v, n + v
assert v < n, 'got more rows than expected!'
if __name__ == '__main__':
select_affected_by_insert()
SQLite 3.6.12
Python 2.6.4
有没有更好的方法来解决这个问题,而不是将数据复制到一个单独的(临时)表并从那里选择?
澄清:我忽略了说我需要在循环中做提交.该过程可能会中断,并且必须提交部分完成的工作,因此不需要在下一次运行时重做.
使用WAL模式(因此作者和读者不会干涉)
为阅读器和写入器使用单独的连接