Удаление дублированных записей в таблице
Удаление дублированных записей в таблице
Подскажите, плиз, как лучше сделать, чтобы удалить из таблицы БД дублированные данные. К примеру, есть в БД такая таблица физические лица, в которую вносятся соответствующие данные.Есть такие люди, которые посредством клиентского ПО заносят эти данные.Так вот эти люди по несколько раз бывают заносят новых физ. лиц, несмотря на то,что подобная информация уже есть в этой БД.В результате база захломляется. Поэтому и нужно избавится от таких двойных записей.
Re: Удаление дублированных записей в таблице
1 - поиском по форумуsundoom писал(а):Подскажите, плиз, как лучше сделать, чтобы удалить из таблицы БД дублированные данные. К примеру, есть в БД такая таблица физические лица, в которую вносятся соответствующие данные.Есть такие люди, которые посредством клиентского ПО заносят эти данные.Так вот эти люди по несколько раз бывают заносят новых физ. лиц, несмотря на то,что подобная информация уже есть в этой БД.В результате база захломляется. Поэтому и нужно избавится от таких двойных записей.
http://ibase.ru/devinfo/deldupes.htm
2 - индексы уникальные не судьба построить?
ИМХО тут проблема несколько шире, чем тупое удаление дубликатов.
Ведь "Иванов", "ивонов" и "Ивaнов" с английской "a" - разные с точки зрения системы записи.
Здесь можно опереться либо на какой-то естественный ключ - например, ИНН, если такой заносится, номер паспорта (хотя это неправильно, его человек может поменять), либо заниматься анализом "схожести" внесённых данных, предварительно приведённых к одному регистру, раскладке, и почищеных от мусора типа пробелов и прочих спецсимволов.
Ведь "Иванов", "ивонов" и "Ивaнов" с английской "a" - разные с точки зрения системы записи.
Здесь можно опереться либо на какой-то естественный ключ - например, ИНН, если такой заносится, номер паспорта (хотя это неправильно, его человек может поменять), либо заниматься анализом "схожести" внесённых данных, предварительно приведённых к одному регистру, раскладке, и почищеных от мусора типа пробелов и прочих спецсимволов.
-
- Сообщения: 52
- Зарегистрирован: 28 сен 2007, 10:19
плят, сделайте там наконец поиск удобный, тогда и дублировать никто ничего не будет! А так нам быстрей нового забить, чем найти уже существующего! И с транзакциями наконец разберитесь, а то определенно точно непонятки будут. Один занес, другой не видит, попытается занести - фиг вам. А то база, у них, видите ли, захламляется. А то, что до 3 НФ она не дотягивает, вас не волнует? Сплошное дублирование данных тоже пофиг? Чего вы сотрудничать-то не хотите? Когда наконец триггеры в порядок приведете?
оооооооо, а вот и пользователь программы автораbelov-evgenii писал(а):плят, сделайте там наконец поиск удобный, тогда и дублировать никто ничего не будет! А так нам быстрей нового забить, чем найти уже существующего! И с транзакциями наконец разберитесь, а то определенно точно непонятки будут. Один занес, другой не видит, попытается занести - фиг вам. А то база, у них, видите ли, захламляется. А то, что до 3 НФ она не дотягивает, вас не волнует? Сплошное дублирование данных тоже пофиг? Чего вы сотрудничать-то не хотите? Когда наконец триггеры в порядок приведете?
-
- Сообщения: 52
- Зарегистрирован: 28 сен 2007, 10:19
-
- Сообщения: 52
- Зарегистрирован: 28 сен 2007, 10:19
-
- Сообщения: 52
- Зарегистрирован: 28 сен 2007, 10:19
а точнее Усольский отдел Иркутской области.belov-evgenii писал(а):Череповец, Вологодская обл.
Кстати, у нас в одном из наших отделов ставили коммерческую прогу от фирмы.Она понравилась значительно.Конечно там были свои недоработки, но это ерунда.НО эно стоит денег.Вот так зажмотило наше государство деньги на продукт, который во многих отношениях очень удобен.
Я слыхал, что в Москве, Питере (в общем в тех районах) используют совсем другую прогу - коммерческую.